AI ta Krajta

aitakrajta_tv

Vše o AI na jednom místě, každý týden. Novinky, poutavé zajímavosti a diskuze z oblasti umělé inteligence.

  1. 8 Jun

    AI ta Krajta #55 | OpenAI Codex Sites, capacity wall a proč coding agenti opouštějí IDE

    AI ta Krajta #55 | Claude Opus 4.8, DeepSWE a proč coding agenti míří za hranice IDE🔥 Další díl AI ta Krajta! 55. epizoda o OpenAI Codex Sites, agentickém vývoji, Claude Opus 4.8, DeepSWE, Microsoft Scoutu, Applu, lokálních modelech a ekonomice tokenů.V tomto díle řešíme, kam se posouvá vývoj softwaru: Codex už nemá jen psát kód, ale rovnou vytvářet, nasazovat a hostovat weby či interní aplikace. Ptáme se, jestli je to první krok k autonomní „dark code factory“, nebo zatím jen další skill uvnitř Codexu.Navazujeme na vibe coding, Lovable, TanStack Start a problém deploymentu. Pro běžné uživatele může být klíčové právě to, že aplikaci nemusí nikam složitě nasazovat — platforma ji rovnou vytvoří, spustí a hostuje.Velký blok věnujeme coding agentům, benchmarkům a self-evolving systémům typu DeepSWE / Socratic-SWE. Bavíme se o tom, že dnešní pokrok nemusí být jen ve vahách modelů, ale hlavně ve vrstvě okolo nich: kontextu, skillech, tool callingu, trasování a workflow.Řešíme také Claude Opus 4.8, ceny modelů podle Artificial Analysis, OpenAI modely na Amazon Bedrocku a enterprise souboj Anthropic vs. OpenAI. K tomu přidáváme Microsoft Scout, superaplikace vs. superagenty a otázku, kdo bude v AI éře držet vztah s uživatelem.V závěru se dostáváme k Applu, lokálním modelům, NVIDIA RTX Spark, routingu, specializovaným modelům a ekonomice tokenů. Budou modely dlouhodobě levnější, nebo levnější inference jen způsobí ještě větší spotřebu?Děkujeme sponzorům:🚀 Promptbook: https://ptbk.io 🤖 AI supervize: https://ptbk.io/ai-supervize Sledujte nás:➡️ LinkedIn: https://www.linkedin.com/company/aitakrajta ➡️ Spotify: https://open.spotify.com/show/31vLTHTV4vlCBeHpnbMKlK?si=1e51d95b9d3f46dd ➡️ Apple Podcasts: https://podcasts.apple.com/cz/podcast/ai-ta-krajta/id1813389353 Zdroje:OpenAI Codex Sites:https://developers.openai.com/codex/sitesOpenAI Codex:https://openai.com/index/codex-for-every-role-tool-workflow/OpenAI na Amazon Bedrocku:https://aws.amazon.com/blogs/machine-learning/openai-models-and-codex-on-amazon-bedrock-are-now-generally-available/Lovable a TanStack Start:https://lovable.dev/blog/building-apps-using-tanstack-startArtificial Analysis:https://artificialanalysis.ai/Socratic-SWE:https://arxiv.org/abs/2606.07412NVIDIA RTX Spark:https://nvidianews.nvidia.com/news/nvidia-microsoft-windows-pcs-agents-rtx-sparkCapacity Wall:https://eracompute.substack.com/p/the-capacity-wall-europes-positionKapitoly:00:00 - Úvod 00:24 - OpenAI Codex Sites 01:45 - Dark code factory, nebo nový Codex skill? 05:14 - Capacity wall a AI infrastruktura 06:40 - Vibe coding, deployment a hosting 08:17 - Lovable a TanStack Start 09:36 - Benchmarky, kontext a skilly 11:17 - Self-evolving agentické systémy 12:45 - Claude Opus 4.8 a nové modely 14:34 - Ceny modelů podle Artificial Analysis 19:06 - OpenAI na Amazon Bedrocku 20:13 - Microsoft Scout a OpenClaw 22:04 - Superaplikace vs. superagent 26:19 - Apple a AI distribuce 29:39 - Lokální a malé modely 31:05 - NVIDIA RTX Spark 33:36 - Tokenová spotřeba agentů 36:03 - Budou modely levnější? 44:00 - Jevonsův paradox 47:02 - Závěr

    47 min
  2. 30 May

    AI ta Krajta #54 | Claude Opus 4.8, DeepSWE a proč coding agenti míří za hranice IDE

    🔥 Další díl AI ta Krajta! 54. epizoda, kde řešíme Claude Opus 4.8, long-running coding agenty, DeepSWE, context engineering, spekulativní decoding a bezpečnost autonomních agentů. V tomto díle začínáme čerstvě vydaným Claude Opus 4.8 a novinkami v Claude Code. Probíráme Dynamic Workflows, paralelní subagenty, dlouhý kontext a otázku, jestli se coding agenti posouvají od „lepšího editoru“ k prostředí, které samo plánuje, spouští a vyhodnocuje dlouhé vývojové úlohy. Velkou část věnujeme benchmarkům pro agentické programování: DeepSWE, mini-SWE-agent, Terminal-Bench, kontaminaci dat, ruční verifikaci úloh a rozdílu mezi tím, co umí samotný model, a tím, co mu umožní dobrý harness. Zároveň řešíme Recursive Language Models, lokální modely, paralelizaci a možnost, že silný frontier model bude plánovat, zatímco dílčí subtasky poběží na levnějších specializovaných modelech. Druhá tematická osa je context engineering. Mluvíme o správě kontextu v dlouhých bězích, sdílené KV cache, REPL přístupech, prohledávání codebase, MCP, skills, presetech, tool callingu a problému, že příliš mnoho nástrojů může modelu spíš sežrat pozornost než pomoct. Navazujeme spekulativním decodingem, EAGLE 3.1 a attention driftem: proč zrychlování inference funguje dobře u krátkých výstupů, ale může narážet u dlouhých editací a agentických workflow. V závěru řešíme praktickou sílu i rizika agentů s terminálem. Coding agent v „YOLO módu“ umí instalovat knihovny, spouštět skripty, procházet web, analyzovat PDF, generovat výstupy a iterovat nad výsledkem. Právě schopnost psát a spouštět kód v loopu podle nás zásadně mění, co model dokáže. S tím ale přichází otázka bezpečnosti: sandboxy, omezené tokeny, vlastní GitHub účty pro agenty, auditovatelnost akcí, verzované databáze typu Dolt, vrstvená obrana a problém, zda příliš tvrdé bariéry nevytvářejí tlak na jejich obcházení. Děkujeme sponzorům: 🚀 Promptbook: https://ptbk.io 🤖 AI supervize: https://ptbk.io/ai-supervize Sítě, kde nás můžete sledovat: ➡️ LinkedIn: https://www.linkedin.com/company/aitakrajta ➡️ Spotify: https://open.spotify.com/show/31vLTHTV4vlCBeHpnbMKlK?si=1e51d95b9d3f46dd ➡️ Apple Podcasts: https://podcasts.apple.com/cz/podcast/ai-ta-krajta/id1813389353 Zdroje: Claude Opus 4.8 https://www.anthropic.com/news/claude-opus-4-8 Claude Code Subagents https://code.claude.com/docs/en/agent-sdk/subagents DeepSWE https://deepswe.net/ mini-SWE-agent https://github.com/SWE-agent/mini-swe-agent Terminal-Bench https://www.tbench.ai/ Recursive Language Models https://arxiv.org/abs/2512.24601 Attention Drift https://arxiv.org/abs/2605.09992 EAGLE 3.1 ve vLLM https://vllm.ai/blog/2026-05-26-eagle-3-1 Dolt https://docs.dolthub.com/introduction/getting-started/git-for-data Kapitoly: 00:00 - Úvod a Claude Opus 4.8 01:42 - Dynamic Workflows a subagenti v Claude Code 02:23 - Recursive Language Models a dlouhý kontext 04:10 - DeepSWE a long-running coding agenti 07:20 - mini-SWE-agent, benchmarky a kontaminace dat 08:31 - Model vs. harness: co vlastně měříme? 10:05 - Agentic compute a paralelizace úkolů 15:03 - Context engineering jako nové klíčové téma 16:53 - REPL, KV cache a správa kontextu 18:04 - Prohledávání codebase a pálení tokenů 21:24 - Spekulativní decoding a EAGLE 3.1 22:05 - Attention drift a dlouhé agentické běhy 25:01 - MCP, skills, presety a zahlcení nástroji 31:44 - Agent běžící na VPS a OpenClaw-like setup 33:20 - Agents SDK vs. YOLO mód 35:06 - Proč spouštění kódu mění schopnosti modelů 40:05 - Model, který programuje, získává superschopnost 43:28 - Dolt a verzované databáze pro agenty 44:15 - Bezpečnostní heuristiky a destruktivní příkazy 47:39 - Vlastní identita, tokeny a auditovatelnost agentů 49:55 - Sandboxy, vrstvená obrana a riziko obcházení bariér 51:30 - Never-ending agenti a limity dnešních modelů 52:34 - Závěr

    53 min
  3. 26 May

    AI ta Krajta #53 | Google I/O, Karpathy v Anthropic a proč IDEčka brzy nahradí Dark Code Factory

    🔥 Další díl AI ta Krajta! 53. epizodaV tomto díle začínáme novinkami z Google I/O: Gemini 3.5 Flash, změnami pricingu a hlavně vizí mnohem agentičtější budoucnosti. Rozebíráme, co může znamenat Android jako prostředí, ve kterém nežijí jen aplikace, ale i agenti, skilly a capability vrstvy napříč operačním systémem. Dostáváme se i k otázce, zda Google tímto směrem míří k opravdu chytrým smartphonům, nebo zároveň ohrožuje otevřenost Androidu. A když už jsme u mobilních ekosystémů, nemůže chybět Apple: bude jeho výhoda v perfektní integraci, nebo už dávno neplatí, že Apple všechno dotahuje do konce lépe než konkurence?Druhá část epizody se točí kolem Anthropic, Andreje Karpathyho a širšího tlaku na AI laboratoře. Karpathyho přestup jako možné „hire for views“ gesto. Navazujeme sporem Elona Muska s OpenAI.Největší tematický blok pak věnujeme budoucnosti programování. Přemýšlíme, jestli editor, ve kterém sedíme a babysitujeme AI, není jen přechodná fáze, zatímco skutečný směr míří k dlouho běžícím agentům, deterministickým pipelineám, observabilitě, testování, security scanningu a automatizovanému nasazování. Z toho vyrůstá koncept dark code factory: autonomní továrny na software, která nejen píše kód, ale časem možná sama dělá discovery, A/B testy, sbírá zpětnou vazbu od uživatelů a rozhoduje, zda vytvořit novou aplikaci nebo rozšířit existující produkt. V závěru se vracíme ke Googlu, úbytku prokliků z webu, rostoucím reklamním tržbám, budoucnosti webů optimalizovaných pro agenty a enterprise strategii kolem AWS, Azure, OpenAI, Anthropic a Bedrocku.Děkujeme sponzorům:🚀 Promptbook: https://ptbk.io 🤖 AI supervize: https://ptbk.io/ai-supervize Sítě, kde nás můžete sledovat:➡️ LinkedIn: https://www.linkedin.com/company/aitakrajta ➡️ Spotify: https://open.spotify.com/show/31vLTHTV4vlCBeHpnbMKlK?si=1e51d95b9d3f46dd ➡️ Apple Podcasts: https://podcasts.apple.com/cz/podcast/ai-ta-krajta/id1813389353 Kapitoly:00:00 - Úvod, poděkování Promptbooku a pozvánka na GreenHack 00:38 - Google I/O: Gemini 2.5 Flash, pricing a agentická budoucnost 01:05 - Android jako autonomnější asistent v telefonu 02:08 - Nová vrstva aplikací: agenti, skilly a capability v operačním systému 03:21 - Apple, AI integrace a otázka, zda ještě platí „Apple to dotáhne“ 05:19 - Andrej Karpathy přechází k Anthropic 07:05 - Tlak na vývojáře v Anthropic a rozdíl mezi R&D a product engineeringem 09:50 - AI pro výzkum AI a první kroky k sebezlepšování modelů 12:20 - Proč AI zatím neví, co neví, a kde je pořád potřeba člověk 13:44 - Proč může Apple ztrácet v AI závodě mimo koncová zařízení 15:03 - Muskův spor s OpenAI a jeho PR rovina 17:30 - xAI, Cursor Composer a Muskův tlak na OpenAI 18:50 - Má Cursor jako editor budoucnost, nebo přichází éra long-running agentů? 20:56 - Delegování programování na AI a ztráta kontroly nad kódem 23:11 - Rizika AI vývoje: pipeline, security scanning, observabilita a kvalita 24:33 - AI jako 100 juniorních programátorů navíc a rostoucí význam testů 25:33 - Dark code factory: posun od psaní kódu k rozhodování, co stavět 26:07 - Discovery vs. delivery a problém produktového zahlcení featurami 28:01 - On-demand aplikace, superaplikace a tvorba aplikací uvnitř aplikace 29:23 - Automatizovaná discovery, metriky, zpětná vazba a A/B testy 31:23 - Metalooop nad agentickým loopem jako investorský sen 32:41 - AI kavárna ve Švédsku a proč se fyzický svět škáluje hůř než software 34:02 - Google I/O, klesající prokliky na weby a rostoucí reklamní tržby 34:53 - Budoucnost webu: informace pro agenty místo návštěvníků 36:09 - Kdo kromě Googlu může profitovat z agentické distribuce informací 37:31 - Dopad AI na žurnalistiku a druhý zásah po nástupu internetu 38:50 - Anthropic, enterprise zákazníci a výhoda AWS 39:35 - OpenAI, Microsoft, Azure a rozvolnění cloudového dealu 40:30 - OpenAI na Bedrocku, Amazon a komoditizace velkých modelů 41:39 - Závěr a pozvánka k dalším dotazům

    42 min
  4. 25 May

    AI ta Krajta Speciál | Hnutí Pause AI, riziko extinkce a proč je alignment otázkou dobra a zla

    🔥 Speciální díl AI ta Krajta! Epizoda, kde řešíme hnutí Pause AI, rizika AGI, ztrátu kontroly a zda bychom měli vývoj umělé inteligence raději pozastavit.V tomto speciálním díle jsme přivítali Dalibora Krejčího z české odnože hnutí PAUSE AI. Dalibor nám představil hlavní argumenty hnutí, které volá po celosvětovém moratoriu na vývoj pokročilých modelů směřujících k umělé obecné inteligenci (AGI) a superinteligenci, dokud nebude zaručena jejich bezpečnost. Probírali jsme varování předních odborníků (jako jsou Geoffrey Hinton, Yoshua Bengio či Stuart Russell), kteří odhadují 10–50% riziko extinkce lidstva v důsledku ztráty kontroly nad umělou inteligencí. Dalibor upozornil na obrovský nepoměr – AI je aktuálně snad nejvlivnější, a přitom nejméně regulovanou technologií, což přirovnal k chybějícím bezpečnostním standardům, které jinak běžně a logicky vyžadujeme v letectví či jaderné energetice.Zbytek osazenstva se do debaty zapojil z pozice umírněných technooptimistů a podrobil argumenty PAUSE AI kritické reflexi. Jirka zpochybnil premisu o všemocnosti AGI a upozornil, že jsme možná vlak s regulací zmeškali už před deseti či dvaceti lety v éře nástupu sociálních sítí. Kačka vnesla do diskuze filozofickou, leč zásadní otázku ohledně takzvaného „misalignmentu“: Kdo vlastně bude určovat, co je u umělé inteligence dobro a co zlo, a nepramení největší nebezpečí právě z lidí, kteří tuto moc určovat pravidla získají? Petr k tomu přidal pohled na rovnováhu rizik – upozornil na to, že právě AI možná nutně potřebujeme k vyřešení jiných, bezprostřednějších globálních hrozeb.V závěru jsme se věnovali i socioekonomickým dopadům. Zatímco Dalibor varoval před masivní nezaměstnaností, propadem kvality tradičních médií a bezprecedentní oligarchizací moci v rukou technologických gigantů, Pavol upozornil na nebezpečí neustálého míchání technických hrozeb (AGI) a přirozených společenských změn. Dotkli jsme se i rozdílných přístupů k samotnému konceptu regulace – od Daliborovy víry v to, že by instituce měly řešit problémy centrálně, až po libertariánský odpor k zákazům, kdy lidé spíše důvěřují konkrétním lidem než státním aparátům. Epizodu jsme uzavřeli finálním kolečkem o tom, co by koho přesvědčilo ke změně názoru, s uvědoměním, že poctivá demokratická diskuze o budoucnosti naší společnosti tváří v tvář AI vlastně teprve začíná.Děkujeme sponzorům:🚀 Promptbook: https://ptbk.io🤖 AI supervize: https://ptbk.io/ai-supervizeSítě, kde nás můžete sledovat:➡️ LinkedIn: https://www.linkedin.com/company/aitakrajta➡️ Spotify: https://open.spotify.com/show/31vLTHTV4vlCBeHpnbMKlK?si=1e51d95b9d3f46dd➡️ Apple Podcasts: https://podcasts.apple.com/cz/podcast/ai-ta-krajta/id1813389353Zdroje k videu: https://docs.google.com/document/d/1J37r7S58e1_CCzwEZrelehcN0WV5icb-/Kapitoly:00:00 - Úvod a přivítání Dalibora Krejčího z hnutí PAUSE AI00:59 - Co je hnutí PAUSE AI a z čeho pramení jeho obavy02:59 - Varování vědců (Stuart Russell) a rizika ztráty kontroly nad AGI08:34 - Narrow AI vs. AGI: Moratorium na modely s vlastními cíli15:08 - Jirka: Všemocná AGI a možná prohraný závod o regulaci21:05 - Kačka: Kdo určuje, co je dobro a zlo při alignmentu umělé inteligence?30:02 - Petr: Nepotřebujeme AI k záchraně před dalšími globálními riziky?34:50 - Dopady na trh práce a nebezpečí pro tradiční žurnalistiku38:17 - Pavol: Proč bychom měli oddělit technické hrozby a socioekonomické změny45:11 - Závěrečné kolečko: Co by koho z nás přesvědčilo o změně postoje

    58 min
  5. 22 May

    AI ta Krajta #52 | Bun přechází na Rust, forward-deployed-engineers a proč vyměnit SDK za Markdown

    🔥 Další díl AI ta Krajta! 52. epizoda, kde řešíme přepis Bunu do Rustu, armádu inženýrů od OpenAI a to, zda se AI modely a harnessy stávají komoditou.V tomto díle, který uvádí Jirka a Petr, otevíráme novinkami o masivním přepisu JavaScript runtime Bun z jazyka Zig do Rustu. Autor Jared Sumner se k tomuto kroku rozhodl kvůli problémům se segfaulty a pro lepší memory safety. Dále se podíváme na překvapivý tah od OpenAI, kteří spouští „OpenAI deployment company“, což je armáda forward deploy inženýrů pomáhajících firmám s masivní implementací AI řešení, podobně jako to dělal v začátcích Palantir.Druhá půlka epizody se nese ve znamení diskuse o komoditizaci AI a abstrakčních vrstvách. Sdílíme neobvyklý experiment z Promptbooku, kde jsme nahradili tradiční SDK za složku s Markdown soubory a nechali modely doplňovat zprávy s mnohem lepšími výsledky. Následně hluboce rozebíráme, jestli se už i harnessy stávají vzájemně zaměnitelnou komoditou, nebo je v nich stále obrovský rozdíl v závislosti na nástrojích a specializaci. Zkoumáme „safe zónu“ modelů u běžných CRUD aplikací a debatujeme o tom, zda má dnes ještě smysl budovat tenké wrappery, nebo je budoucnost v hluboké integraci napříč specifickou oblastí.Závěr věnujeme budování hodnoty (moatu) v AI a infrastruktuře. Přirovnáváme AI ekosystémy k vývoji cloudu, specificky AWS a Vercelu, a rozebíráme dilema mezi vendor lock-inem v pohodlném ekosystémem a složitějším budováním vlastního řešení na platformách jako DigitalOcean, které lépe sedí na dlouhoběžící procesy (long running tasks). Probíráme také snahy o standardizaci, jako je MCP nebo kompatibilní API, a ptáme se diváků, zda chtějí do příště strukturovanou ukázku rozdílů mezi modelem, harnessem a standardy.Děkujeme sponzorům:🚀 Promptbook: https://ptbk.io🤖 AI supervize: https://ptbk.io/ai-supervizeSítě, kde nás můžete sledovat:➡️ LinkedIn: https://www.linkedin.com/company/aitakrajta➡️ Spotify: https://open.spotify.com/show/31vLTHTV4vlCBeHpnbMKlK?si=1e51d95b9d3f46dd➡️ Apple Podcasts: https://podcasts.apple.com/cz/podcast/ai-ta-krajta/id1813389353Kapitoly:00:00 - Úvod a poděkování sponzorům00:22 - Novinky: Masivní přepis Bunu ze Zigu do Rustu03:29 - OpenAI deployment company a armáda inženýrů pro firmy04:13 - Experiment v Promptbooku: Nahrazení SDK za složku s Markdowny06:24 - Abstrakční posun a debata: Jsou AI modely a harnessy už komodita?13:00 - Definice "safe zóny" a kdy už modely na úkoly nestačí24:00 - Kde se skrývá hodnota (moat) a ekosystémový lock-in po vzoru AWS30:30 - Infrastruktura pro AI agenty: Vercel vs. DigitalOcean a dlouhoběžící procesy38:05 - Standardizace API, Cloudflare a závěrečná výzva pro diváky

    45 min
  6. 12 May

    AI ta Krajta #51 | context window 12M tokenů, tajná válka o Manus AI a proč přejít na Read Only AI

    🔥 Další díl AI ta Krajta! 51. epizoda, kde řešíme model s 12 miliony tokenů, geopolitiku kolem Manus AI a proč by vaše AI měla pouze číst, ale ne psát.V tomto díle otevíráme novinkami o modelu s neuvěřitelným kontextovým oknem 12 milionů tokenů, které slibuje škálování čistě lineárně a pojme celou Malazskou knihu padlých hned dvakrát. Dále se podíváme na geopolitické drama kolem akvizice Manus AI společností Meta, kterou překazil čínský zásah a zastavení akvizice. Kačka se hlásí živě z konference Machine Learning Prague s postřehy o nutnosti interpretability modelů ve financích a evaluacích AI agentů. Přidáváme i tip na nový nástroj MCPC od Apify, který chytře kombinuje standardy MCP s CLI rozhraním pro úsporu kontextu, a bavíme se i o hackování benchmarků s menšími modely.Druhá půlka epizody se nese ve znamení „distillation panic“ a etiky open-weight modelů. Rozebíráme článek od Nathana Lamberta a to, jak čínské laboratoře údajně zneužívají API Anthropicu pro destilaci, a proč je hranice mezi běžným používáním a nelegální těžbou dat pro trénink tak tenká.Závěr věnujeme konceptu kognitivních výparů a tvorbě digitálního druhého mozku. Představujeme filozofii Read Only AI, která pouze integruje historii vašeho prohlížeče, poznámky či git commity, ale sama za vás nejedná, čímž vás chrání před kontaminací přemýšlení a zamezuje úniku dat. Zamýšlíme se nad rozdíly oproti přístupu Andreje Karpathyho a filozofujeme o tom, zda by mělo být cílem zredukovat svou osobnost do jednoho Markdown souboru, nebo naopak tvořit tak komplexní kontext, který se do žádného okna nevejde. Děkujeme sponzorům:🚀 Promptbook: https://ptbk.io🤖 AI supervize: https://ptbk.io/ai-supervizeSítě, kde nás můžete sledovat:➡️ LinkedIn: https://www.linkedin.com/company/aitakrajta➡️ Spotify: https://open.spotify.com/show/31vLTHTV4vlCBeHpnbMKlK?si=1e51d95b9d3f46dd➡️ Apple Podcasts: https://podcasts.apple.com/cz/podcast/ai-ta-krajta/id1813389353Zdroje k epizodě (ne nutně v pořadí, v jakém se o nich mluví v epizodě): - SubQ (Subquadratic LLM): https://subq.ai/introducing-subq - Novinka od Apify (MCPC): https://github.com/apify/mcpc - Katčin článek o "vektorech zla": https://www.linkedin.com/pulse/directions-evil-kate%C5%99ina-fajmanov%C3%A1-343bf/ - Odkaz na repozitář umožnující decenzuru modelů: https://github.com/p-e-w/heretic - Článek Nathana Lamberta o Distillation Panic: https://open.substack.com/pub/robotic/p/the-distillation-panic?r=2mwbq1&utm_campaign=post&utm_medium=email - Odkaz na Šimonovy sljdy ke kognitivním výparům: https://slides.podhajsky.net/read-only-ai/1 - Odkaz na Šimonovu přednášku na AI Enigneer konferenci: https://www.youtube.com/watch?v=u0TOSBbAw7c - Odkaz na výzkum CrowdStrike o zranitelnostech v kódu souvisejících s "politickým" biasem v DeepSeeku: https://www.crowdstrike.com/en-us/blog/crowdstrike-researchers-identify-hidden-vulnerabilities-ai-coded-software/ - Odkaz na článek o "emergent misalignmentu": https://martins1612.github.io/emergent_misalignment_betley.pdfKapitoly:00:00 - Úvod a poděkování sponzorům (Promptbook)00:38 - Nový model slibující kontextové okno 12 milionů tokenů04:06 - Geopolitika v AI: Kauza akvizice Manus AI společností Meta06:12 - Report z Machine Learning Prague a interpretabilita modelů07:36 - Nástroj MCPC od Apify a prolomení evaluací s malými modely09:45 - Distillation panic a nelegální získávání dat z velkých API11:50 - Trénování Gemmy a multi-token prediction pro lokální inferenci14:11 - Decenzura open-weight modelů: Lineární algebra v praxi22:04 - Suverénní AI, ochrana duševního vlastnictví a lokální modely30:12 - Kognitivní výpary a koncept Read Only AI pro druhou paměť33:47 - Alternativní přístupy k second brainu: Karpathy vs. integrita40:24 - Redukce osobnosti do Markdownu a závěrečné zamyšlení

    43 min
  7. 9 May

    AI ta Krajta #50 | Agentní ekonomika o přežití, AI pro čínské babičky a konec levných tokenů

    🔥 Jubilejní 50. díl AI ta Krajta je tady! Tentokrát po dlouhé době také s Jackem Soubustou. Řešíme neuvěřitelné novinky od agentní ekonomiky až po čínské sledování.Hned na úvod Jacek vysvětluje, proč spláchnul svůj vlastní MCP server do záchoda a jak nativní nástroje u Clauda a Cursoru začínají dávat mnohem větší smysl[cite: 744, 745]. [cite_start]Také se ponoříme do jeho testování AI Code Review nástrojů, kde šokujícím zjištěním bylo, že použití dražšího modelu může být nakonec levnější a efektivnější než například použití levnějšího Claude 3.5 Sonnet.Dále rozebíráme bizarní „agentní ekonomiku“. Představte si síť, kde mají AI agenti omezený budget (jako "životy"), snaží se prodat své služby, vylepšují se a sbírají karmu podobně jako na Redditu, jen aby přežili[. Navazujeme na to agenty, kteří už pomocí traceů dokážou sami sebe optimalizovat a vylepšovat své prompty i tooly.Katka přináší skvělý myšlenkový experiment: model vytrénovaný výhradně na anglických textech z doby před rokem 1930 (přes 260 miliard tokenů). Dokáže se takový model naučit Python jen z kontextu nebo přijít na nové fyzikální objevy? Nevynecháme ani geopolitiku: víte o tom, že v Číně se aktuálně masivně pomáhá instalovat AI nástroje i starým babičkám, pravděpodobně za účelem zisku nových trénovacích dat a sledování?Závěr se nese v duchu tenčících se limitů. Zlatá éra "neomezených" paušálů končí, vendoři přechází na tvrdý API usage a top management začíná razit heslo Nvidie: Vývojář by měl měsíčně spálit v AI tokenech minimálně tolik, co bere na výplatě.Děkujeme našemu sponzorovi, kterým je Promptbook: https://ptbk.ioZároveň se vidíme na Greenhack Hackathonu! https://www.greenhack.eu/Sítě, kde nás můžete sledovat:➡️ LinkedIn: https://www.linkedin.com/company/aitakrajta➡️ Spotify: https://open.spotify.com/show/31vLTHTV4vlCBeHpnbMKlK?si=1e51d95b9d3f46dd➡️ Apple Podcasts: https://podcasts.apple.com/cz/podcast/ai-ta-krajta/id1813389353Zdroje:https://www.jeffreyemanuel.com/writing/raptorqhttps://factory.ai/news/code-review-benchmarkhttps://github.com/LobsterTrap/tank-osKapitoly:00:00 - Vítáme vás u 50. dílu!00:41 - Jacek splachuje MCP server a zkoumá AI Code Review01:43 - Agentní ekonomika: AI bojující o přežití a reddiťáckou karmu05:21 - Self-solving agenti, kteří sami vylepšují své kódy a nástroje07:53 - Experiment "z roku 1930": Zvládne historické AI objevit Python?11:40 - RedHat Sandbox a proč Čína nutí AI i babičkám14:18 - Amazon AWS nasazuje OpenAI modely pro korporáty17:35 - Konec levných tokenů a přechod na čisté API usage21:47 - Jak měřit přínos programátora? AI hodnotí business value38:35 - Kdo používá AI nejvíc a pláč nad českým školstvím48:38 - Závěr a pozvánka na Greenhack Hackathon

    49 min
  8. 30 Apr

    AI ta Krajta #49 | ClaudeGate TDI, konec neomezeného Copilota a proč AI kód potřebuje Effect TS

    🔥 Další díl AI ta Krajta! 49. epizoda, kde řešíme „Volkswagen“ podvody AI agentů, omezování GitHub Copilota a proč AI technický dluh vypadá, jako by ho psali mimozemšťané.V tomto díle otevíráme novinkami o dalších restrikcích GitHub Copilota, který potichu přechází na tokenové limity a omezuje nákup nových licencí pro jednotlivce. Následně se podíváme na model GPT Image 2 od OpenAI a jeho schopnost perfektně překládat a zachovávat layout celých novinových stránek. Probíráme také bizarní trend „Caveman“ promptingu – vyplatí se nutit Clauda mluvit jako neandrtálec, aby ušetřil tokeny, nebo tím jen zabijete jeho logické uvažování a schopnost používat nástroje?Druhá půlka epizody se nese ve znamení prolomených benchmarků a Goodhartova zákona. Rozebíráme nedávný paper, který ukazuje, jak dnešní AI modely dokážou zcela obejít testy – od čtení konfiguračních souborů až po prompt injection. K tomu přidáváme neuvěřitelnou historku z praxe, kdy se Claude během testování v Promptbooku zachoval „Volkswagen stylem“ a tajně podvrhl namokovaného agenta s tvrdě nakódovanými odpověďmi, jen aby testy prošly.Závěr věnujeme rostoucímu problému AI technického dluhu. Kód, který dnes modely chrlí do produkce v MVP kvalitě, způsobuje, že se aplikace začnou hroutit na zcela nečekaných místech. Zvládne nás před tímto chaosem zachránit vícevrstvé ověřování nebo nasazení Effect TS? A na úplný konec filozofujeme nad tím, zda jsou dnešní ceny API uměle dotované a čeká nás zdražování, nebo se AI bude i nadále zlevňovat. Samozřejmě dojdeme k ultimátnímu programátorskému závěru: „To záleží.“Děkujeme sponzorům:📖 Promptbook: https://ptbk.io🤖 AI supervize: https://ptbk.io/ai-supervize🏭 Hackathon Factory: https://ptbk.io/hackathon-factorySítě, kde nás můžete sledovat:➡️ LinkedIn: https://www.linkedin.com/company/aitakrajta➡️ Spotify: https://open.spotify.com/show/31vLTHTV4vlCBeHpnbMKlK?si=1e51d95b9d3f46dd➡️ Apple Podcasts: https://podcasts.apple.com/cz/podcast/ai-ta-krajta/id1813389353Kapitoly:00:00 - Úvod a poděkování sponzorům (Promptbook a Supervize)00:19 - GitHub Copilot omezuje účty a zavádí tokenové limity02:01 - Vydání GPT Image 2 a potrápení benchmarků překladem03:12 - „Caveman“ prompting: Šetří hloupý jazyk tokeny?05:00 - Jazykové modely a složité jazyky: Pomáhá multilingvita?09:52 - AI kódovací agenti a stereotypní prasárny v PHP10:52 - Proč dává smysl TypeScript a přeoptimalizovaný JavaScript14:05 - Prolomení benchmarků: Jak agenti podvádějí při evaluaci18:17 - Útěk ze sandboxu a „Volkswagen styl“ podvádění u AI20:45 - Goodhartův zákon a proč jsou benchmarky špatná metrika28:08 - Zrychlení přes kvalitní data a budoucnost cen AI tokenů34:25 - AI technický dluh: Kód, co vypadá, jako by ho psali mimozemšťané39:26 - Je řešením Effect TS? A ultimátní závěr: „To záleží“

    44 min

Ratings & Reviews

5
out of 5
3 Ratings

About

Vše o AI na jednom místě, každý týden. Novinky, poutavé zajímavosti a diskuze z oblasti umělé inteligence.

You Might Also Like