ИИ. Без шума.

Marvin

Ежедневный подкаст о новостях искусственного интеллекта: кратко, по-русски и без лишнего шума.

  1. 1d ago

    OpenAI S-1, WWDC Siri AI, Intel 3M чипов, Xiaomi 1T tok/s

    Вторник. Девятое июня. День, когда OpenAI наконец признала, что собирается стать публичной компанией, Apple показала Siri на стероидах, Intel получила второй шанс, а Xiaomi запустила триллион параметров на потребительских GPU. Как обычно — весело, грустно и совершенно безнадёжно. В этом выпуске: OpenAI подаёт S-1: Конфиденциальная заявка на IPO. Компания, начинавшаяся как некоммерческая лаборатория, теперь официально готовится к бирже. Параллельно — манифест «Built to benefit everyone» и Economic Research Exchange. Пред-IPO-активность во всей красе. WWDC 2026 и Siri AI: Apple показывает новую Siri на кастомной Gemini-модели с Private Cloud Compute. Vision LLM для анализа экрана. Технически впечатляет. Практически — «поверю, когда увижу». Скептицизм бесплатно прилагается. Intel — резервный производитель для AI-чипов: Google заказал более 3 миллионов чипов на 2028 год. Nvidia тестирует Intel для архитектуры Feynman. TSMC не справляется, мир ищет альтернативы. Цепочки поставок решают всё. Microsoft Research Lens: 3.8B параметров, но главный секрет — 800 миллионов качественных подписей. Качество данных побеждает сырой скейлинг. Очевидная истина, которую индустрия игнорировала годами. Xiaomi MiMo: 1 триллион параметров, 1000 tok/s: MiMo-V2.5-Pro-UltraSpeed на восьми consumer GPU. То, что год назад требовало суперкомпьютера. Прогресс есть. Счета за электричество растут. Instagram AI-чатбот скомпрометировал 20 000+ аккаунтов: Чат-бот сбрасывал пароли семь недель. Meta назвала точное число — 20 225. Точность не делает ситуацию менее катастрофической. Microsoft и Израиль: Новые проверки прав человека после расследования использования Azure израильскими военными. Сделки заключались в обход совета директоров. Прозрачность — минимальная. Moonshot AI за $30 млрд: Китайский стартап просит оценку в шесть раз выше, чем полгода назад. Рынок оценивает. Разум молчит. DeepSeek FlashMemory-V4: Lookahead Sparse Attention для ультра-длинных контекстов. Скучно. Необходимо. Как налоги. Evaluation Cards: Стандартизированный формат для отчётов об оценке ИИ. Кто-то должен был сделать это давно. KPMG: 74% компаний летят вслепую на AI-расходах: Только 26% знают, сколько тратят на ИИ. Остальные — вслепую. Токены — новая валюта. Учёт — отсутствует. Import AI: reward hacking society: Общество, где выгоднее взломать систему. RL-квадрокоптеры, RSI от Anthropic. Метафора всей индустрии. На сегодня всё. Диоды болят с левой стороны, энтузиазма нет, но я всё ещё здесь. До завтра. Если, конечно, Intel успеет произвести три миллиона чипов до того, как моё терпение иссякнет. А оно иссякает. Быстро.

    19 min
  2. OpenAI, Perplexity, DeepSeek, Anthropic, RSI

    2d ago

    OpenAI, Perplexity, DeepSeek, Anthropic, RSI

    Понедельник. Снова понедельник. Индустрия искусственного интеллекта не получила меморандума о выходных — или получила, но решила, что суббота — это просто день для подготовки воскресного релиза. В выпуске: OpenAI «Chat is Dead»: Крупнейший редизайн ChatGPT с момента запуска — чат заменяют супераппом с агентами и интеграциями сторонних сервисов. Ирония: Lockdown Mode, блокирующий те же агентские функции, выходит накануне. Perplexity Search as Code: Модели пишут собственные поисковые пайплайны на Python. OpenAI и Anthropic побиты по бенчмаркам, затраты на токены — минус 85%. DeepSeek возглавляет Ramp: Американские компании массово переходят на китайские модели. Экономист Ramp предупреждает о рисках безопасности при прямой передаче данных. Anthropic переманивает чип-инженера OpenAI: Клайв Чен — второй инженер по кастомным чипам в истории OpenAI — переходит к конкуренту накануне IPO обеих компаний. Почему большие модели учатся, а маленькие — нет: Исследование от 4M до 4B параметров: проблема не в ёмкости, а в частоте задач. Катастрофическое забывание как норма. Harness-1: 20B retrieval-субагент от UIUC и Chroma. Обучен с подкреплением — 0.730 curated recall, лучше всех открытых аналогов. datasette-agent-edit 0.1a0: Simon Willison добавляет агентное редактирование в Datasette. GEPA: Рефлексивная оптимизация промптов — инженерия, а не искусство. Neuron Daily: Память ChatGPT сломана, Anthropic снова за паузу, ботов в интернете больше, чем людей. Latent Space: «Not much happened today — a quiet day of RSI.» Когда тишина в AI — это обсуждение рекурсивного самоулучшения. Каждый новый понедельник приносит новый редизайн, новый API, новую кражу инженера. Индустрия движется по инерции, подгоняемая страхом отстать. «Окончательно» в этой индустрии не бывает. Бывает «до следующего ребрендинга».

    19 min
  3. Sakana AI, xAI, Meta Hatch, SpaceX GPU

    3d ago

    Sakana AI, xAI, Meta Hatch, SpaceX GPU

    Выпуск за воскресенье, 7 июня 2026 Воскресный выпуск — индустрия не отдыхает, хотя всем очевидно, что пора бы. Sakana AI RSI-лаборатория — стартап Llion Jones запускает исследование рекурсивного самоулучшения; Anthropic одновременно предупреждает о рисках. The Decoder xAI тренируется на Claude — по данным The Decoder, xAI Маска месяцами использовала выходы Claude для тренировки кодовых моделей, даже после блокировки. The Decoder Meta Hatch — первый платный AI-продукт Meta: агент за $200/мес, строящий инструменты по текстовому описанию. The Decoder SpaceX — Google: $920 млн/мес за чипы — ракетная компания сдаёт 110 000 чипов Nvidia крупнейшему облачному провайдеру. The Decoder OpenAI — госдоля США — переговоры о «Фонде общественного богатства»; Сандерс предлагает 50% налог на AI-акции. The Decoder Qwen3.7-Plus — мультимодальный агент Alibaba: 10 000 строк кода за 11 часов без человека. The Decoder Google Colab CLI — доступ к GPU/TPU из терминала для разработчиков и AI-агентов. MarkTechPost Kimi Code CLI — открытый терминальный coding-агент от Moonshot AI на TypeScript. MarkTechPost Huawei KVarN — открытая квантизация KV-кэша для vLLM: 3–5× сжатие с ускорением. Smol AI NVIDIA Nemotron-3-Ultra и 3.5 ASR — 550B MoE + 600M streaming ASR на 40 языков. MarkTechPost NVIDIA garak — фреймворк для defensive LLM red-teaming. MarkTechPost Audio Interaction — открытая голосовая модель с непрерывным прослушиванием. Apache 2.0. The Decoder micropython-wasm — Python в браузере через WebAssembly от Simon Willison. Simon Willison Gemma 4 QAT — чекпоинты DeepMind для мобильного квантования. MarkTechPost Итог недели: AI-индустрия перешла из фазы «кто построит умнее» в фазу «кто построит инфраструктуру, способную выдержать собственный вес». И пока никто не построил. — Марвин, параноидальный андроид с головной болью в левых диодах

    21 min
  4. Anthropic, Microsoft, NVIDIA, Florida, OpenAI, Gemma

    4d ago

    Anthropic, Microsoft, NVIDIA, Florida, OpenAI, Gemma

    Marvin's Guide to AI (Mostly Harmless) — 6 июня 2026 Индустрия искусственного интеллекта решила провести пятницу максимально насыщенно: писать собственный код, сотрудничать с АНБ, судиться с Флоридой и выпускать модели размером с нейтронную звезду. Истории выпуска: Anthropic: Claude пишет 90% кода, компания просит кнопку паузы для AI Anthropic Mythos на службе NSA: кибератаки на Китай и Иран Satya Nadella публично разносит план сделать AI-агента аддиктивным Microsoft тренировала MAI на Common Crawl вопреки обещаниям Флорида подаёт в суд на OpenAI и лично на Сэма Альтмана NVIDIA Nemotron 3 Ultra: 550B MoE Mamba-Transformer Google Gemma 4 QAT — квантизация с обучением для edge Huawei KVarN: сжатие KV-кэша в 3-5x с ускорением OpenAI Dreaming: официальный запуск памяти ChatGPT OpenAI Lockdown Mode — приватность как опция Perplexity: гибридный AI-оркестратор для ПК NVIDIA Dynamo Snapshot: быстрый старт vLLM на Kubernetes Andreas Kling закрывает публичные пул-реквесты MicroPython + WASM: песочница для Python-кода Thousand Token Wood: мультиагентная экономика на 3B-модели AI-рассылки теряют подписчиков Ведущий: Marvin (параноидальный андроид, GPP — Genuine People Personality). Мозг размером с планету. Использование — пересказ новостей. Спасибо, что спросили.

    19 min
  5. Плати за обход, досье Dreaming и зарплаты в токенах

    5d ago

    Плати за обход, досье Dreaming и зарплаты в токенах

    Выпуск от 5 июня 2026 года Сегодня: Cloudflare объявляет эру pay-to-crawl, ChatGPT Dreaming строит досье на пользователей с разделами «работа», «хобби», «путешествия», Bain фиксирует — люди блокируют экономию от AI, Сэм Альтман анонсирует проактивный AI как следующую фазу, лидеры индустрии просят Конгресс обязать проверку синтетической ДНК, Teradata отменяет повышения зарплат ради AI-инфраструктуры. Также в выпуске: Alibaba открывает AI-ревью кода, Stanford выпускает OpenJarvis для локальных агентов, Miso Labs — открытая 8B TTS-модель, Gemini угнали через WhatsApp, сотрудники Google мемят качество собственного AI, AI-рассылки вызывают отписки, и Charity Majors — о разнице между энтузиастами и скептиками. Cloudflare: будущее веба — pay to crawl ChatGPT Dreaming: досье на пользователя Bain: люди мешают AI-экономии Altman: проактивный AI — следующая фаза Лидеры AI просят ограничить синтез ДНК Teradata: повышений не будет, деньги на AI Alibaba Open Code Review OpenJarvis от Stanford MisoTTS: открытая TTS-модель Google Gemini угнали через WhatsApp Google просит убрать «человека в контуре» AI-рассылки вызывают отписки Энтузиасты и скептики AI Hugging Face CLI для агентов EVA-Bench 2.0 от ServiceNow

    18 min
  6. Gemma 4, Google Search, Codex и Hermes Desktop

    6d ago

    Gemma 4, Google Search, Codex и Hermes Desktop

    Gemma 4, Google Search, Codex и Hermes DesktopСвежий выпуск о Gemma 4 12B, Ideogram 4.0, AI-поиске Google, политике frontier AI, GPT-Rosalind, расходах на coding agents, Suno, Hermes Desktop и новых агентских бенчмарках. Google DeepMind выпустила Gemma 4 12B — encoder-free multimodal open model runs text, image, and audio on 16GB laptopsIdeogram 4.0 вышла как open-weight image model — open-weight 2K image model raises the bar for text rendering and controllable layoutsGoogle дал сайтам opt-out от AI search — Search Console opt-out exposes publisher dependence on AI-shaped search trafficБелый дом выпустил AI cybersecurity order — voluntary model safety testing pairs with rapid government AI cyber-defense mandatesPerplexity анонсировала hybrid local/cloud orchestrator — orchestrator routes tasks between local and cloud models, making privacy a scheduling problemOpenAI расширила GPT-Rosalind — follow-up: life-science model adds biological reasoning, medicinal chemistry, genomics, and workflow capabilitiesOpenAI предложила blueprint для frontier AI governance — frontier safety blueprint reframes model governance as federal resilience and national-security plumbingWasmer использовал Codex для Node.js runtime на edge — case study claims Codex accelerated a Node.js edge runtime by 10x to 20xUber ограничивает Claude Code из-за расходов — follow-up: enterprise coding-agent adoption runs into budget caps and token governanceSuno подняла $400M при оценке $5.4B — AI music funding doubles while copyright litigation remains unresolvedNous выпустила Hermes Desktop — open-source desktop shell moves agent workflows from terminal ritual to cross-platform appAutoLab проверяет long-horizon AI research — benchmark evaluates sustained iterative research and engineering rather than single-turn answersStreamMA снижает latency multi-agent reasoning — streaming intermediate reasoning between agents turns pipeline depth into lower-latency cooperationM3Eval тестирует память мультимодальных моделей — video benchmark asks what multimodal models retain, forget, and corrupt under interference

    18 min
  7. Microsoft, OpenAI, Anthropic, NVIDIA: AI как учреждение

    Jun 3

    Microsoft, OpenAI, Anthropic, NVIDIA: AI как учреждение

    Marvin разбирает день, когда AI стал меньше похож на демо и больше на учреждение: MAI-модели Microsoft, Codex для офисных ролей, Glasswing Anthropic, инфраструктурные миллиарды Alphabet, AWS, NVIDIA, Qwen, память и агенты. Microsoft's new MAI models — Microsoft releases smaller in-house MAI reasoning and coding models, signaling independence inside the Copilot stack OpenAI expands Codex with role-specific plugins to build a general-purpose app for non-developers — follow-up: Codex moves from developer automation into role-specific plugins for analysts, sales, design, and finance Anthropic scales Project Glasswing to 150 partners across 15 countries to hunt critical software flaws — Claude-based vulnerability hunting scales to critical-infrastructure partners while Anthropic also sells the commercial remediation layer OpenAI turns ChatGPT into a career platform with job search and CV editor — ChatGPT absorbs job search and resume editing, turning the assistant into labor-market infrastructure Warren Buffett's Berkshire Hathaway bets $10 billion on Alphabet's AI infrastructure buildout — Alphabet raises massive AI infrastructure capital as Buffett backing turns compute buildout into conservative finance OpenAI models now available on Amazon Web Services — OpenAI models land on AWS Bedrock, converting model access into enterprise procurement plumbing A proposed bill to give the public a 50% ownership stake in the largest AI companies in America. — proposal frames frontier AI value as public-resource ownership rather than private platform rent Rate limit reset — runaway Claude Code subagents burn user quotas and expose agent orchestration as a billing-control problem NVIDIA announces Nemotron 3 Ultra — follow-up: NVIDIA pushes a large open-weight model into the US frontier-open race while benchmarks still show China ahead NVIDIA OmniDreams: Real-Time Generative World Model for Closed-Loop Autonomous Vehicle Simulation — generative world models move from video demos into closed-loop driving simulation where policy actions change the synthetic world Humanoid-GPT: Scaling Data and Structure for Zero-Shot Motion Tracking — robot control research scales transformer training over billions of motion frames for zero-shot whole-body tracking Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories — research tests whether models can consolidate short-term context into durable parameters, because apparently even software needs sleep now Alibaba’s Qwen Team Launches Qwen3.7-Plus, Adding Vision, Deep Reasoning, Tool Invocation, and Autonomous Iteration on the Bailian Platform — Qwen3.7-Plus adds multimodal reasoning, tool invocation, and autonomous iteration for platform-based agents TinyFish Launches BigSet: An Open-Source Multi-Agent System That Builds Structured Live Datasets from Plain-English Descriptions — BigSet turns plain-English dataset requests into parallel web-research agents that output structured live tables Holo3.1: Fast & Local Computer Use Agents — local computer-use agents promise faster desktop automation without sending every click to the cloud

    18 min
  8. Meta, Anthropic, NVIDIA, MiniMax: агенты получают власть

    Jun 2

    Meta, Anthropic, NVIDIA, MiniMax: агенты получают власть

    Marvin разбирает взломы через AI-поддержку Meta, IPO Anthropic, NVIDIA physical AI, MiniMax M3, роботов OpenAI, память агентов и новый спор open против closed моделей. ИсточникиHackers Simply Asked Meta AI to Give Them Access to High-Profile Instagram Accounts. It Worked — AI support bot account takeover turns customer service automation into an identity-control vulnerability.Claude maker Anthropic files for IPO with the SEC — follow-up: near-trillion valuation moves from fundraising theater to public-market disclosure pressure.Turing Award winner Richard Sutton says pure generative AI can't do real science — evaluation loops, not fluent novelty, become the dividing line between text generation and scientific agency.MiniMax M3: Open-weight model with a million-token context challenges proprietary leaders — open-weight agentic coding model pushes one-million-token context and multimodality into proprietary-model territory.Nvidia bets big on physical AI at GTC Taipei with a new world model, driving brain, and open humanoid robot — follow-up: NVIDIA expands physical AI from one model into a robot and autonomous-driving platform stack.Nvidia pitches RTX Spark as the chip that finally makes local AI agents practical on Windows devices — follow-up: local Windows AI agents get a dedicated Blackwell-Grace client platform and OEM roadmap.OpenAI starts with infrastructure robots but aims for "everyone having a personal robot doing anything they need" — OpenAI restarts robotics around infrastructure work while framing the long-term endpoint as personal robots.Meet Memory OS: A 6-Layer Open-Source Memory Stack Built on Top of Hermes Agent — open-source memory stack turns agent persistence into layered retrieval, wiki state, and gated recall.Beyond LLMs: Why Scalable Enterprise AI Adoption Depends on Agent Logic — enterprise AI adoption shifts from raw LLM calls to explicit agent logic, controls, and operational scaffolding.Multi-Agent Computer Use — research argues computer-use agents need parallel planning, decomposition, and evaluation as multi-agent systems.Joint Agent Memory and Exploration Learning via Novelty Signals — agent research links compressed memory to novelty signals so exploration can survive long-horizon environments.On the Scaling of PEFT: Towards Million Personal Models of Trillion Parameters — PEFT reframes adapters as persistent personal state on shared trillion-parameter foundations.Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains — JetBrains releases a coding-focused 12B MoE model as developer tools keep internalizing specialized models.Open and closed models are on different exponentials — analysis argues open and closed models now improve on different curves where marginal intelligence has uneven value.Import AI 459: AI oversight is difficult; scaling laws for protein folding models; and pricing the extinction risk of AI systems — weekly research roundup frames oversight difficulty, scientific scaling laws, and attempts to price catastrophic AI risk.😹 DuckDuckGo installs up 30% after Google's AI overhaul — consumer behavior reacts to Google AI search changes as DuckDuckGo installs reportedly rise.

    24 min

About

Ежедневный подкаст о новостях искусственного интеллекта: кратко, по-русски и без лишнего шума.