Ai Talk Podcast by Dominik Wojcik

Dominik Wojcik

Wir sprechen über KI, LLMs, AI Agents, SEO und Online Marketing. Im Fokus stehen neue Tools, aktuelle Entwicklungen, praktische Learnings und die Frage, was davon wirklich nützlich ist und was eher Hype bleibt.

Episodes

  1. 1d ago

    Bis zu 14.000€ Token-Wert für 200€ Abo!, Google erfolgreich verklagt, etc...| AI Talk 11.06.2026

    OpenAI und Anthropic subventionieren ihre Abo-Modelle massiv – und eine neue Analyse zeigt, wie extrem das Missverhältnis wirklich ist. 00:00:06 | Intro & Themenüberblick Worum es geht: Preiskampf, Fable-Test, Google-Haftung 00:00:34 | Claude Fable – Ersteindruck Mythos-Architektur, Stärken im Coding, Schwächen in anderen Wissensbereichen 00:01:13 | Fable vs. Opus 4.8 Direktvergleich im Host-Workflow – Opus 4.8 bleibt vorn 00:03:09 | Fable fliegt aus Subscriptions Zugang endet ~22. Juni; danach nur noch API zu 50 $/1M Token 00:05:00 | Subscription vs. API – Die Subventions-Analyse SemiAnalysis-Daten: Token-Gegenwert je Plan von Claude Pro bis ChatGPT Pro 00:07:00 | Die 14.000-Dollar-Zahl erklärt ChatGPT Pro (200 $/Monat) entspricht ~14.000 $ API-Gegenwert; Claude Max (200 $) ~8.000 $ 00:08:07 | Break-even und Margenrisiko Anthropic break-even bei ~20 % Auslastung; OpenAI-200-$-Plan rentiert sich nur unter 5,7 % 00:09:52 | Preiskampf: OpenAI senkt Token-Preise WSJ-Bericht: OpenAI plant massive Preissenkungen als Reaktion auf Fable 00:11:12 | Fable-API-Preis und Einordnung Aktuell 50 $/1M Token (vorher 125 $) – immer noch ~2× teurer als Opus 00:13:46 | Empfehlung: Welche Tools jetzt nutzen? Cursor, Claude Code, ChatGPT Pro – solange die Subventionierung anhält 00:16:04 | Google AI Overviews – Klage und SEO-Konsequenzen Zwei Verlage klagen; nur ~1 % der Nutzer klicken auf Quellenangaben 00:19:02 | EU-Haftungsurteil: Google haftet für falsche Overviews Regelung vom 3. Juni, 9 Monate Übergangsfrist, Einspruchsrecht für Publisher 00:20:51 | Googles rechtliche Gegenwehr Revision wahrscheinlich; langfristige Konsequenzen noch offen 00:21:48 | Apex Agents Benchmark: Gemini Flash 3.5 vs. Claude Sonnet 5 Gemini Flash 3.5 ~50 %, Claude Sonnet 5 ~45 % – gezieltes Agentic-Training als Erklärung 00:23:20 | Gemini 3.5 Pro – Vorsicht mit dem Hype Early-Access-Feedback bisher verhalten 00:28:12 | Tool-Tipp: TextLottie Lottie-Animationen direkt aus Codex/Claude Code generieren 00:30:27 | Praxistest: Website-Rebuild mit Claude/Fable Komplette Homepage inkl. CMS und dynamischer Hero-Animation 00:33:58 | Fazit & Ausblick Subscription-Fenster nutzen, Preiskampf beobachten, Google-Entwicklung verfolgen --- Shownotes: WSJ berichtet über geplante drastische Preissenkungen bei OpenAI als Reaktion auf Anthropics neues Modell: https://www.wsj.com/tech/ai/openai-considers-drastic-price-cuts-anticipating-war-for-users-with-anthropic-9b8c178e?mod=e2tw SemiAnalysis analysiert Subscription- vs. API-Margen bei OpenAI und Anthropic – inklusive Break-even-Berechnung: https://x.com/SemiAnalysis_/status/2064815042374074396 Heise berichtet über das Münchner Urteil: Google muss für falsche Aussagen in AI Overviews haften: https://www.heise.de/en/news/LG-Munich-I-Google-ordered-to-pay-for-false-statements-in-AI-summaries-11327217.html Jake warnt davor, Token-Kosten auf Basis von Durchschnittspreisen zu berechnen – Modelle verbrauchen sehr unterschiedliche Mengen: https://x.com/JakeKAllDay/status/2064870609796898862/photo/1 TextLottie: Open-Source-Skill für Codex und Claude Code, der Lottie-Animationen direkt aus dem Coding-Agenten generiert: https://x.com/konstipaulus/status/2064011863889788972 - Quelle zu: https://www.theinformation.com/newsletters/the-briefing/german-court-ruling-google-spotlights-ai-liability-question - Maßgeschneiderte KI-Strategien und -Lösungen – von der Idee über das Modell-Training bis zur produktiven Integration: https://wojcik.de - The biggest IPO in history is now 4x oversubscribed, with SpaceX $SPCX drawing $250B in demand against a $75B raise: https://x.com/NoLimitGains/status/2064439231968166348

    35 min
  2. 4d ago

    Loops statt Prompten, Claude Mythos Leaks & Personal-Wechsel | AI Talk Mo. 08.06.2026

    Zwei Themen dominieren die KI-Woche – und beide zeigen, wie schnell sich Begriffe und Erwartungen verselbstständigen, bevor die Realität sie einholt. Peter Steinbergers Tweet vom 7. Juni hat 2,2 Millionen Views gesammelt. Sechs Wörter: „You should be designing loops that prompt your agents." Problem: In den Replies streiten alle darüber, was das überhaupt bedeutet. Die Folge erklärt Boris Chernys Definition vom WorkOS-Event, zeigt die fünfjährige Entwicklungsgeschichte von ReAct über AutoGPT bis zur heutigen Orchestrierungsebene – und nimmt den Cron-Job-Einwand ernst. Dazu ein konkretes Praxisbeispiel: 90 Minuten autonomes Codex-Coding, 630.000 Tokens, ein eigener LLM-Benchmark steigt von 90,1 auf 91,0 Prozent. Parallel brodelt der Hype um Claude Mythos. Leak-Outputs aus der DevMode-Community zeigen einen macOS-Klon mit 50.000 Tokens und funktionierendem Browser, einen Cut-the-Rope-Nachbau mit Level-Editor und Musik-Generierung über Code – alles auf Low Thinking Effort. Anthropic-interne Daten sollen 52-fache Trainings-Code-Speedups in bestimmten Optimierungsaufgaben zeigen. Polymarket sah die Release-Wahrscheinlichkeit innerhalb einer Woche bei 40 Prozent – vier Tage zuvor lag sie noch bei 3 Prozent. Preisgerüchte: rund 125 Dollar pro einer Million Output-Token, zwei Versionen für Endnutzer und Enterprise. Außerdem: Clive Chan verlässt OpenAI nach 2,4 Jahren im Custom-Chip-Programm und wechselt zu Anthropic. OpenAI plant den eigenen Inferenz-Chip für H2 2026. Apple WWDC bringt ein neues Siri, möglicherweise mit Gemini-Backend. Und Ramp-Kreditkartendaten für Juni zeigen: Anthropic führt im B2B-Wachstum – OpenAI taucht nicht mehr unter den Top-Playern auf. 00:00:08 Intro & Format 00:03:17 Claude Mythos – erste Community-Outputs 00:06:00 Generierungszeit und Kosten 00:07:13 GPT-5.06 – erste Infos aus internen Tests 00:15:33 Mythos-Preise und zwei Versionen 00:18:21 Release-Prognose via Polymarket 00:20:32 Mythos-Preise konkret: $125 pro 1M Output-Token 00:21:22 Gemini 3.5 Pro Leak 00:25:32 Peter Steinbergers viraler Loop-Tweet 00:26:44 Loop vs. Prompt – was ist der Unterschied? 00:29:31 Praxisbeispiel: 90 Minuten autonomes Codex-Coding 00:32:53 Sub-Agents und parallele Loops 00:36:37 Warnung: Token-Kosten können explodieren 00:38:15 Loop-Coding erklärt: Der Mensch schreibt die Schleife 00:40:18 Verifikation als wichtigster Erfolgsfaktor 00:40:43 Das größte Risiko bei AI-Agents 00:41:05 Skills sind das Asset, nicht der Loop 00:41:35 Vom Prompt Engineer zum Agent-Orchestrator 00:42:22 Brain Drain: Chip-Ingenieur wechselt von OpenAI zu Anthropic 00:43:38 OpenAIs eigener Inferenz-Chip 00:44:01 Apple WWDC: Neues Siri mit Gemini-Backend? 00:46:27 Ramp-Marktdaten Juni: Wer wächst wirklich? 00:47:21 Anthropic führt – OpenAI verliert Boden 00:48:37 Abschluss & Ausblick Shownotes: Der virale Tweet, der die Debatte ausgelöst hat – mit Einordnung der Loop-Definition und fünfjähriger Entwicklungsgeschichte: https://x.com/mvanhorn/status/2063865685558903149 Weitere Mythos-Outputs auf Low Effort, mit Hinweis auf deutlich bessere Ergebnisse bei xHigh/Max: https://x.com/Lentils80/status/2063686677160149501 Mythos-Output-Thread mit Pixel Art, Piano-Musik-Visualizer und Cut-the-Rope-Nachbau aus der DevMode-Community: https://x.com/mirochill/status/2062931007725015356 Mythos generiert Musik über Code – Einordnung als „First Principles"-Ansatz für Audio: https://x.com/chetaslua/status/206361381924369210 Polymarket-Einordnung: Release-Wahrscheinlichkeit von 3 % auf 40 % in vier Tagen, Modell kurz in Anthropic-UI aufgetaucht: https://x.com/goodworse/status/2063579122555662763 Mythos vs. GPT-5.6 – Vergleich von Leak-Outputs, mit Hinweis auf möglichen IPO-Hype als Verzerrungsfaktor: https://x.com/notjazii/status/2063272880708956258 Clive Chan verlässt OpenAI nach 2,4 Jahren im Custom-Chip-Programm und wechselt zu Anthropic: https://x.com/itsclivetime/status/2063356118525792542

    53 min
  3. Jun 5

    LoRA Fine-Tuning für SEO: Mein eigenes LLM Experiment

    In dieser AI Talk Folge geht es um mein Experiment, ein eigenes SEO LLM per LoRA Fine-Tuning zu trainieren. Ich spreche darüber, wie ich aus meinem SEO Benchmark Trainingsdaten erstelle, warum gute Datensätze wichtiger sind als reine Menge und wie ich ein Open-Weight-Modell gezielt für technische SEO-Aufgaben, strukturierte Daten, Onpage, Offpage, Crawling und Agent-Workflows optimieren möchte. Außerdem geht es um Qwen 3.6, lokale LLMs, RunPod, GPU-Setups, Benchmarks, Student-Teacher-Ansätze und die Frage, ob ein kleineres Modell nah genug an große Topmodelle herankommen kann, um in echten Workflows deutlich günstiger eingesetzt zu werden. Ein großer Teil der Folge zeigt auch, warum Fine-Tuning ein iterativer Prozess ist: trainieren, testen, Fehler analysieren, Trainingsdaten verbessern und erneut benchmarken. Kapitel: 00:00 Einstieg: Warum ein eigenes SEO LLM?02:42 SEO Benchmark, Student-Teacher-Prinzip und Modellvergleich05:12 Codex, Claude Code, Cursor und aktuelle Coding-Tools07:48 Trainingsstatus, Setup und lokale Modelle13:15 Qwen 3.6 als Basis für das Fine-Tuning17:48 Aufbau der SEO-Trainingsdaten24:45 Training starten, Datensätze kuratieren und LoRA verstehen30:42 Benchmark-Test mit dem neuen Modell32:36 Iteration: Trainieren, testen, verbessern39:02 Erste Ergebnisse, Rückschritte und Learnings46:38 Analyse mit starken Modellen und Vorbereitung für V457:14 Neuer Trainingslauf mit optimierten Beispielen58:15 Nächster Schritt: Tool- und Function-Calling-Training59:54 Fazit: Wie ich LLMs optimiere01:02:05 Warum Benchmark und Trainingsdaten getrennt bleiben müssen01:03:06 Ziel: Ein günstigeres spezialisiertes SEO Brain Modell

    53 min
  4. Jun 2

    Meta AI Hack, Nvidia DGX Power & eigene SEO Modelle: Warum AI Agents noch wackeln

    In dieser AI Talk Folge geht es um Nvidia DGX Spark, lokale LLMs, neue Open-Weight-Modelle, Minimax M3, Coding-Benchmarks, ein neues Video-Modell von xAI und den Meta Support Assistant Hack. Außerdem zeige ich mein nächstes Experiment: ein eigenes SEO LLM per LoRA Fine-Tuning. Dafür will ich aus meinem SEO Benchmark Trainingsdaten bauen und ein Modell stärker auf technische SEO-Aufgaben, Crawling, Onpage, Offpage und Agent-Workflows optimieren. Kapitelübersicht: 00:00 Neues Setup und KI-Co-Host 02:42 Alphabet und AI-Infrastruktur 05:02 Nvidia DGX Spark und lokale LLMs 07:30 KI im Betriebssystem 10:30 DGX Station und Blackwell Power 14:23 Nvidia Nemotron 3 Ultra 17:19 Minimax M3 für Coding 21:41 Neues Video-Modell von xAI 24:04 Coding-Benchmarks und Modellpreise 28:11 Meta Support Assistant Hack 31:37 KI-Co-Host im Live-Test 33:19 Eigenes SEO LLM per LoRA 41:37 Anthropic IPO und Preisdruck 50:20 Fazit und Ausblick 02.06.2026 · AI Talk 3 Shownotes Grok Imagine Video 1.5 Preview | xAI Docs: Pricing $0.08 per second Pricing Output $0.08 per second You are charged for each second of video generated when using the API. https://docs.x.ai/developers/models/grok-imagine-video-1.5-preview Meta's AI chatbot helped attackers take over Instagram accounts | heise online: The attack vector was made public by US tech magazine 404 Media , which refers to Telegram groups of security researchers and hacking group… https://www.heise.de/en/news/Meta-s-AI-chatbot-helped-attackers-take-over-Instagram-accounts-11314517.html Persönlicher KI-Supercomputer | NVIDIA DGX Station: Tensor-Recheneinheiten der NVIDIA Blackwell-Generation NVIDIA DGX Station verfügt über Tensor-Recheneinheiten der NVIDIA Blackwell Generation, die 4-Bit-Gleitkomma-KI… https://www.nvidia.com/de-de/products/workstations/dgx-station/ NASDAQ-Aktie Alphabet schwächer: Riesen-Kapitalerhöhung geplant - Blick auf den Berkshire-Anteil | finanzen.net: Google befindet sich damit in guter Gesellschaft: Amazon etwa plant, rund 200 Milliarden Dollar zu investi… https://www.finanzen.net/nachricht/aktien/ausbau-alphabet-aktie-sinkt-mega-kapitalerhoehung-fuer-ki-offensive-berkshire-anteil-im-blick-15723078 Warren Buffett steigt mit 10 Milliarden Dollar bei Alphabets KI-Offensive ein: Juni 2026 Alphabet plant eine Kapitalerhöhung von 80 Milliarden Dollar, um seine KI-Infrastruktur auszubauen. https://the-decoder.de/warren-buffett-steigt-mit-10-milliarden-dollar-bei-alphabets-ki-offensive-ein/ OpenAI models and Codex on Amazon Bedrock are now generally available | Artificial Intelligence: More than 5 million people use Codex every week to write, refactor, debug, test, and validate code across large codebases. https://aws.amazon.com/blogs/machine-learning/openai-models-and-codex-on-amazon-bedrock-are-now-generally-available/ Regional availability - Amazon Bedrock: Virginia) Legacy (EOL: 2026-09-30) Rerank Region In-Region Geo Global us-west-2 (Oregon) ca-central-1 (Canada) eu-central-1 (Frankfurt) ap-northeast-1 (Tokyo) Nova Sonic Region In… https://docs.aws.amazon.com/bedrock/latest/userguide/models-region-compatibility.html Nemotron 3 Ultra: Nvidias neues Open-Source-Modell ist laut Benchmark das stärkste der USA: Bild: AAII Beim Anbieter DeepInfra liefert Nemotron 3 Ultra laut Artificial Analysis zudem mehr als 300 Token pro Sekunde. https://the-decoder.de/nemotron-3-ultra-nvidias-neues-open-source-modell-ist-laut-benchmark-das-staerkste-der-usa/ Anthropic confidentially submits draft S-1 to the SEC \ Anthropic: Skip to main content Skip to footer Try Claude Announcements Anthropic confidentially submits draft S-1 to the SEC Jun 1, 2026 Today, Anthropic, PBC con… https://www.anthropic.com/news/confidential-draft-s1-sec MiniMax M3: Frontier Coding, 1M Context, Native Multimodality — All in One Model - MiniMax Research | MiniMax: Its clean, scalable, easy-to-implement, and hardware-friendly characteristics allow its theoretical gains to… https://www.minimax.io/blog/minimax-m3

    53 min
  5. May 28

    Ai Agents - Zukunft oder Trash? Mein Talk auf der OMfinCon!

    In dieser Folge gibt es meinen Vortrag von der OMfinCon zum Thema AI Agents im Marketing. 43 Minuten über den aktuellen Stand von AI Agents, warum SEO ein besonders spannender Use Case dafür ist und wie ich mir mit Autonomo SEO ein eigenes SEO AI Team gebaut habe. Ich zeige, wie einzelne Agents, ein Brain Orchestrator, ein Heartbeat Agent, Memory, Skills, APIs, MCP, eigene Crawler, Benchmarks und Human in the Loop zusammenspielen. Außerdem geht es sehr ehrlich um die Grenzen aktueller Agent-Systeme: instabile APIs, Gateway Issues, Token-Kosten, Kontextverlust, Authentifizierung, DSGVO, Modellverhalten und die Frage, wann AI Agents wirklich Marketing-Teams unterstützen können. Kapitelübersicht: 00:00 Einstieg: Warum AI Agents jetzt relevant werden01:18 Rückblick: Frühe KI-Prognosen und ChatGPT02:26 Google, Disruption und Anpassungsfähigkeit03:15 Spezialisierte Chatbots und erste Agent-Erfahrungen05:24 OpenClaw, Hermes und aktuelle Agent-Frameworks10:30 Warum SEO ein guter Use Case für Agents ist11:26 Warum ich ein eigenes Agent-System gebaut habe12:49 Autonomo SEO: Ein Team aus SEO Agents13:19 Chat mit einzelnen Agents und Brain Orchestrator15:19 Teamchat: Wie Agents untereinander kommunizieren16:03 Heartbeat Agent: Das Herzstück des Systems16:50 Individuelle Agent-Einstellungen, Modelle und Memory18:38 Task-Übersicht, Priorisierung und Freigaben20:43 Outreach, Linkbuilding und Onpage-First-Ansatz21:38 Workflows statt einzelner Tasks23:18 Skills, APIs und MCP als Agent-Werkzeuge25:10 Lokale Tools, Browser-Plugins und Server-Zugriffe26:14 Eigener SEO Crawler für Agent-Projekte28:13 Monitoring, Kostenkontrolle und Token-Verbrauch29:19 Settings, Fokussteuerung und Kommunikationskanäle30:12 LLM Benchmarking für eigene Use Cases33:14 Technical SEO Benchmark: Überraschende Modell-Ergebnisse34:16 Onpage Benchmark: Warum Mistral stark performt35:45 Der Agent-Kindergarten: Die größten Praxisprobleme36:06 Gateway Issues, Provider-Ausfälle und instabile APIs37:10 Guardrails, Skills und MCP-Probleme38:01 Memory-Systeme, Authentifizierung und Kontextverlust39:10 Modellverhalten, DSGVO und Zuverlässigkeit40:55 Warum aktuelle Modelle noch nicht stark genug sind41:59 Ausblick: Wann Agents echte Marketing-Teams unterstützen können42:53 Fazit: Human in the Loop bleibt entscheidend

    44 min

About

Wir sprechen über KI, LLMs, AI Agents, SEO und Online Marketing. Im Fokus stehen neue Tools, aktuelle Entwicklungen, praktische Learnings und die Frage, was davon wirklich nützlich ist und was eher Hype bleibt.