42 Min.

Wie knacke ich die KI‪?‬ Der KI-Podcast

    • Wissenschaft

Jeder, der schon mal mit KI-Sprachmodellen zu tun hatte, kennt es: man will eine bestimmte Antwort vom Chatbot - doch der weigert sich hartnäckig, diese zu geben. Es gibt aber Tricks, um LLMs und andere GenAI-Modelle gefügig zu machen: sogenannte Pompt Hacks, Jailbreaks oder Prompt Injections. Wir erklären, was hinter diesen Begriffen steckt, wie diese Methoden funktionieren und wir fragen: Ist es gut oder schlecht, wenn KI-Modelle nicht alle Fragen beantworten, die wir ihnen stellen?

In dieser Folge:
00:00 Intro
02:38 Was sind Prompt Hacks und wie funktionieren sie?
13:30 Wie Marie einen Chatbot dazu brachte, ihr 3000 Proteinriegel zu versprechen
19:47 Fritz und DeepSeek: Wer bestimmt, was KI-Modelle sagen?
30:10 Sollen Chatbots immer auf alle Fragen Antworten geben?
34:32 Was haben wir diese Woche mit KI gemacht?

Redaktion und Mitarbeit:
David Beck, Cristina Cletiu, Chris Eckardt, Fritz Espenlaub, Marie Kilg, Mark Kleber, Gudrun Riedl, Christian Schiffer, Gregor Schmalzried

Links und Quellen:
- Chevrolet of Watsonwille verkauft Chevy Tahoe für $1 https://www.theautopian.com/chevy-dealers-ai-chatbot-allegedly-recommended-fords-gave-free-access-to-chatgpt/
- Findet man in LLMs gefährlichere Informationen zu Biowaffen als in Google? https://www.rand.org/pubs/research_reports/RRA2977-2.html
- Der chinesische Chatbot DeepSeek und das Tiananmen-Massaker: https://www.linkedin.com/posts/peter-gostev_it-took-some-effort-but-i-managed-to-get-activity-7152042996635521024-2hBZ/
- KI macht Job-Interviews: https://www.micro1.ai/gpt-vetting
- Airline haftet für Fehler ihres Chatbots: https://www.theguardian.com/world/2024/feb/16/air-canada-chatbot-lawsuit
- Maries Theaterstück: Anna und Eve in der Neuköllner Oper https://www.neukoellneroper.de/performance/anna-eve/
- Was steckt hinter dem mysteriösen neuen Chatbot GPT2? https://news.ycombinator.com/item?id=40199715
https://arstechnica.com/information-technology/2024/04/rumors-swirl-about-mystery-gpt2-chatbot-that-some-think-is-gpt-5-in-disguise/

Kontakt:
Wir freuen uns über Fragen und Kommentare an podcast@br.de.

Unterstützt uns:
Wenn euch dieser Podcast gefällt, freuen wir uns über eine Bewertung auf eurer liebsten Podcast-Plattform. Abonniert den KI-Podcast in der ARD Audiothek oder wo immer ihr eure Podcasts hört, um keine Episode zu verpassen. Und empfehlt uns gerne weiter!

Jeder, der schon mal mit KI-Sprachmodellen zu tun hatte, kennt es: man will eine bestimmte Antwort vom Chatbot - doch der weigert sich hartnäckig, diese zu geben. Es gibt aber Tricks, um LLMs und andere GenAI-Modelle gefügig zu machen: sogenannte Pompt Hacks, Jailbreaks oder Prompt Injections. Wir erklären, was hinter diesen Begriffen steckt, wie diese Methoden funktionieren und wir fragen: Ist es gut oder schlecht, wenn KI-Modelle nicht alle Fragen beantworten, die wir ihnen stellen?

In dieser Folge:
00:00 Intro
02:38 Was sind Prompt Hacks und wie funktionieren sie?
13:30 Wie Marie einen Chatbot dazu brachte, ihr 3000 Proteinriegel zu versprechen
19:47 Fritz und DeepSeek: Wer bestimmt, was KI-Modelle sagen?
30:10 Sollen Chatbots immer auf alle Fragen Antworten geben?
34:32 Was haben wir diese Woche mit KI gemacht?

Redaktion und Mitarbeit:
David Beck, Cristina Cletiu, Chris Eckardt, Fritz Espenlaub, Marie Kilg, Mark Kleber, Gudrun Riedl, Christian Schiffer, Gregor Schmalzried

Links und Quellen:
- Chevrolet of Watsonwille verkauft Chevy Tahoe für $1 https://www.theautopian.com/chevy-dealers-ai-chatbot-allegedly-recommended-fords-gave-free-access-to-chatgpt/
- Findet man in LLMs gefährlichere Informationen zu Biowaffen als in Google? https://www.rand.org/pubs/research_reports/RRA2977-2.html
- Der chinesische Chatbot DeepSeek und das Tiananmen-Massaker: https://www.linkedin.com/posts/peter-gostev_it-took-some-effort-but-i-managed-to-get-activity-7152042996635521024-2hBZ/
- KI macht Job-Interviews: https://www.micro1.ai/gpt-vetting
- Airline haftet für Fehler ihres Chatbots: https://www.theguardian.com/world/2024/feb/16/air-canada-chatbot-lawsuit
- Maries Theaterstück: Anna und Eve in der Neuköllner Oper https://www.neukoellneroper.de/performance/anna-eve/
- Was steckt hinter dem mysteriösen neuen Chatbot GPT2? https://news.ycombinator.com/item?id=40199715
https://arstechnica.com/information-technology/2024/04/rumors-swirl-about-mystery-gpt2-chatbot-that-some-think-is-gpt-5-in-disguise/

Kontakt:
Wir freuen uns über Fragen und Kommentare an podcast@br.de.

Unterstützt uns:
Wenn euch dieser Podcast gefällt, freuen wir uns über eine Bewertung auf eurer liebsten Podcast-Plattform. Abonniert den KI-Podcast in der ARD Audiothek oder wo immer ihr eure Podcasts hört, um keine Episode zu verpassen. Und empfehlt uns gerne weiter!

42 Min.

Top‑Podcasts in Wissenschaft

Aha! Zehn Minuten Alltags-Wissen
WELT
Sternengeschichten
Florian Freistetter
Das Wissen | SWR
SWR
radioWissen
Bayerischer Rundfunk
Quarks Daily
Quarks
KI verstehen
Deutschlandfunk