47 Min.

KI-Benchmarks haben mehr Probleme als Lösungen Digital Podcast

    • Technologie

KI-Entwickler brüsten sich stolz mit den Zahlen, die ihre Systeme in Benchmark-Tests erreichen. Wir erklären, wie KI-Benchmarks funktionieren und fragen: Wie aussagekräftig sind solche Tests wirklich? Und kommt es am Ende vielleicht bloss auf die «Vibes» an?

Der ganze Podcast im Überblick:

(00:01:28) Was sind eigentlich KI-Benchmark-Tests?

(00:06:23) Neun Probleme

(00:34:27) Drei Lösungen

Chatbot Arena:

https://chat.lmsys.org

SRF Geek Sofa bei Discord:

https://discord.gg/geeksofa

KI-Entwickler brüsten sich stolz mit den Zahlen, die ihre Systeme in Benchmark-Tests erreichen. Wir erklären, wie KI-Benchmarks funktionieren und fragen: Wie aussagekräftig sind solche Tests wirklich? Und kommt es am Ende vielleicht bloss auf die «Vibes» an?

Der ganze Podcast im Überblick:

(00:01:28) Was sind eigentlich KI-Benchmark-Tests?

(00:06:23) Neun Probleme

(00:34:27) Drei Lösungen

Chatbot Arena:

https://chat.lmsys.org

SRF Geek Sofa bei Discord:

https://discord.gg/geeksofa

47 Min.

Top‑Podcasts in Technologie

13 Minutes to the Moon
BBC World Service
The TED AI Show
TED
#heiseshow (Audio) - Technik-News und Netzpolitik
heise online
The Vergecast
The Verge
Computer und Kommunikation
Deutschlandfunk
Flugforensik - Abstürze und ihre Geschichte
Flugforensik

Mehr von Schweizer Radio und Fernsehen

Sternstunde Philosophie
Schweizer Radio und Fernsehen (SRF)
Krimi
Schweizer Radio und Fernsehen (SRF)
Echo der Zeit
Schweizer Radio und Fernsehen (SRF)
Lustig to go
Schweizer Radio und Fernsehen (SRF)
Hörspiel
Schweizer Radio und Fernsehen (SRF)
Jazz Collection
Schweizer Radio und Fernsehen (SRF)