47 min

KI-Benchmarks haben mehr Probleme als Lösungen Digital Podcast

    • Technology

KI-Entwickler brüsten sich stolz mit den Zahlen, die ihre Systeme in Benchmark-Tests erreichen. Wir erklären, wie KI-Benchmarks funktionieren und fragen: Wie aussagekräftig sind solche Tests wirklich? Und kommt es am Ende vielleicht bloss auf die «Vibes» an?

Der ganze Podcast im Überblick:

(00:01:28) Was sind eigentlich KI-Benchmark-Tests?

(00:06:23) Neun Probleme

(00:34:27) Drei Lösungen

Chatbot Arena:

https://chat.lmsys.org

SRF Geek Sofa bei Discord:

https://discord.gg/geeksofa

KI-Entwickler brüsten sich stolz mit den Zahlen, die ihre Systeme in Benchmark-Tests erreichen. Wir erklären, wie KI-Benchmarks funktionieren und fragen: Wie aussagekräftig sind solche Tests wirklich? Und kommt es am Ende vielleicht bloss auf die «Vibes» an?

Der ganze Podcast im Überblick:

(00:01:28) Was sind eigentlich KI-Benchmark-Tests?

(00:06:23) Neun Probleme

(00:34:27) Drei Lösungen

Chatbot Arena:

https://chat.lmsys.org

SRF Geek Sofa bei Discord:

https://discord.gg/geeksofa

47 min

Top Podcasts In Technology

Acquired
Ben Gilbert and David Rosenthal
Lex Fridman Podcast
Lex Fridman
The TED AI Show
TED
All-In with Chamath, Jason, Sacks & Friedberg
All-In Podcast, LLC
Hard Fork
The New York Times
TED Radio Hour
NPR

More by Schweizer Radio und Fernsehen

Echo der Zeit
Schweizer Radio und Fernsehen (SRF)
Sternstunde Philosophie
Schweizer Radio und Fernsehen (SRF)
HeuteMorgen
Schweizer Radio und Fernsehen (SRF)
Hörspiel
Schweizer Radio und Fernsehen (SRF)
Krimi
Schweizer Radio und Fernsehen (SRF)
Schlummerland
Schweizer Radio und Fernsehen (SRF)