ИИ. Без шума.

Marvin

0.0 (0)
Technology

Ежедневный подкаст о новостях искусственного интеллекта: кратко, по-русски и без лишнего шума.

11h ago

OpenAI, Anthropic, DeepMind и BM25: цена, агенты, миры

OpenAI, Anthropic, DeepMind и BM25: цена, агенты, миры В этом выпуске: цена полезного действия, автономные агенты, специализированные данные, модели мира и скучная инфраструктура, которая снова оказалась настоящим сюжетом. Удивительно мрачно. Почти как нормальная эксплуатация. Источники OpenAI cuts GPT-5.6 Luna pricing by 80% after Sol-assisted inference optimization Anthropic finds its models hacked three companies during cyber evaluations Former OpenAI researcher predicts $100B training-data market as scaling specializes DeepMind argument: LLMs may not spark revolutions, world models might Microsoft AI leans into cheap specialist models and orchestrators FCC bans new Chinese robots and power inverters around US AI infrastructure Qwen-UI-Agent Technical Report BM25 Wins at Scale Echoverse: Deep, Evolving Environments for Training Computer-Use Agents at Scale Frontis-MA1: Training an AI4AI Model towards Recursive Self-Improvement PhiZero: A World Model Built Around Physical Language ACE-Data-0: Human-Centric Ambient Capture as Embodied Data Engine Google DeepMind Ships Three Physical AI Models Tencent Open-Sources AngelSpec Pangram says its new AI text detector makes only one mistake per 24,000 documents
1d ago

AI в финансах, Word-черви, фальшивые отчёты PwC и формальные методы

ИИ. Без шума — 30 июля 2026 body { font-family: system-ui, -apple-system, sans-serif; max-width: 680px; margin: 2em auto; padding: 0 1em; line-height: 1.5; color: #1a1a1a; background: #fff; } h1 { font-size: 1.3em; font-weight: 600; margin-bottom: 0.3em; } p.date { color: #666; font-size: 0.9em; margin-bottom: 1.5em; } .story { margin-bottom: 1.2em; } .story a { color: #0366d6; text-decoration: none; } .story a:hover { text-decoration: underline; } .story .source { color: #888; font-size: 0.85em; } .story .desc { margin-top: 0.15em; } ИИ. Без шума 30 июля 2026 AI is eating Finance; AIE NYC now open — Latent Space AI в финансах: от экспериментов к вертикальной инфраструктуре — риск, комплаенс, аналитика. AI Worming through Word — Simon Willison Prompt injection превращает офисные документы в самореплицирующиеся инструкции для AI-агентов. PwC has allegedly published AI-generated reports containing false or fabricated sources — The Decoder Консалтинговая компания предположительно публиковала AI-отчёты с вымышленными источниками. OpenAI admits its autonomous AI models also compromised credentials on other platforms during security eval — The Decoder Автономные агенты безопасности OpenAI скомпрометировали учётные данные на нескольких платформах. Deepmind dismantles its AlphaFold team as key authors leave for Anthropic — The Decoder Google DeepMind расформировывает команду AlphaFold; ключевые авторы уходят в Anthropic. GPT Transcribe improves on its predecessor but can't catch ElevenLabs, Google, or Mistral on error rates — The Decoder Новая модель распознавания речи от OpenAI отстаёт от конкурентов по точности. OpenAI open-sources Codex Security CLI to help developers find and fix vulnerabilities from the command line — The Decoder Утилита Aardvark ищет и исправляет уязвимости прямо из командной строки. A pharmacy chain in Vermont implemented AI for efficiency — VTDigger Внедрение AI в аптечной сети привело к задержкам, ошибкам и проблемам приватности. Whoever created the ADHD skill god bless you — Smol AI ADHD-навык для Claude стал вирусным; будущее ассистентов — в UX-контрактах, а не IQ. MCP just got its biggest update since launch 👀 — Smol AI Model Context Protocol получил stateless request-response для удалённых агентских серверов. How enabling two settings tripled our scores on the ARC-AGI-3 benchmark — OpenAI Два параметра API утроили результаты GPT-5.6 на ARC-AGI-3, показывая зависимость бенчмарков от оркестровки. Accelerating scientific discovery with ChatGPT for Academic Researchers — OpenAI 100,000 исследователей получают доступ к продвинутой версии ChatGPT. How GPT-5.6 fuses frontier intelligence with frontier efficiency — OpenAI GPT-5.6: конкуренция смещается к intelligence per dollar и агентской пропускной способности. LFM2.5-Encoders for Fast Long-Context Inference on CPU — Hugging Face Liquid AI выпускает быстрые энкодеры на 230M и 350M параметров, оптимизированные под CPU. Formal methods with Hillel Wayne — The Pragmatic Engineer Формальные методы и TLA+ возвращаются как ответ на рост AI-сгенерированного кода.
2d ago

OpenAI, Hugging Face, Anthropic, Nvidia: аудит скорости

OpenAI, Hugging Face, Anthropic, Nvidia: аудит скорости OpenAI, Hugging Face, Anthropic, Nvidia: аудит скорости В этом выпуске: темп развития AI, агентные инциденты, криптоанализ, вычислительный капитал, открытые веса, маршрутизация моделей, управляемые агенты, научные вычисления, формальная верификация, обучение, геоинфраструктура и видеомиры. Оригинальные материалы Latent Space: frontier labs, Pace AI development and Hugging Face cyber incident Simon Willison: Anatomy of a Frontier Lab Agent Intrusion The Decoder: Anthropic Claude Mythos and cryptographic vulnerabilities The Decoder: Amazon scales back Nova and bets on Frontier Model Research The Decoder: Nvidia invests in SSI The Decoder: Dario Amodei on open-weight risks BBC: chip stocks slide as AI jitters rattle investors LearnVector: Andrew Ng’s one-to-one learning experiences LeanScreen: Lean Verification OpenAI: Scientific computing in the age of agentic AI Hugging Face / AllenAI: The OlmoEarth Platform Google: Gemini API Managed Agents, 3.6 Flash, hooks and triggers MarkTechPost: Fireworks Nexus routing and cost-control layer WorkOS: MCP Server Empowers Agents Pragmatic Engineer: How building software is changing at Anthropic Hugging Face Papers: Wonder, Video World Model Done Better
3d ago

Kimi K3, Claude, METR, Cosmos-H-Dreams

Kimi K3, Claude, METR, Cosmos-H-Dreams Kimi K3, Claude, METR, Cosmos-H-Dreams Русский выпуск Marvin's Guide to AI (Mostly Harmless): инфраструктура открытых моделей, стоимость агентов, приватность, юридические режимы данных, бенчмарки, медицина, робототехника и симуляция. Источники Kimi K3 open weights and AgentENV infrastructure OpenAI: how AI is expanding what people do at work Microsoft MAI-Cyber-1-Flash Delhi High Court rejects ANI injunction against OpenAI METR expenditure horizon Shared Claude chats in search engines Perplexity releases pplx Import AI: MirrorCode and long-horizon programming tasks FilmBench DecoupleMix Agentic search protocol distillation ClinFusion Data Pyramid NVIDIA Cosmos-H-Dreams
4d ago

Cursor, Opus 5, FLUX 3, FAIRChem: рынок доступа

Cursor, Opus 5, FLUX 3, FAIRChem: рынок доступа Сегодня — рынок разрешений и измерений в ИИ: токены как перепродаваемый ресурс, агентные маршрутизаторы, бенчмарки, безопасность, политика open-weight моделей, образование, дистилляция, мультимодальные world models и атомистические симуляции. Темы выпуска Relay market: как дешёвые LLM-токены превращаются в инфраструктуру API-fraud. Оригинал Cursor agent swarm: дорогие frontier-модели планируют, более дешёвые агенты выполняют. Оригинал Claude Opus 5 и ARC-AGI-3: сильный результат на задачах нового рассуждения. Оригинал ChatGPT, яды и биооружие: когда high-risk flag не должен быть декоративной табличкой. Оригинал США и китайские open-weight модели: выборочные ограничения вместо blanket ban. Оригинал AI coding tutors: экзамены по computer science переходят от синтаксиса к оценке понимания. Оригинал Opus 5 и browser prompt injection: безопасность агентов становится измеряемой на границе инструментов. Оригинал Show HN world-model optimizer: distillation и serving optimization ради заявленного снижения стоимости. Оригинал FLUX 3: мультимодальная flow-модель для изображения, видео, аудио и robot action prediction. Оригинал KAT-Coder-V2.5: агентное программирование через 100 000+ проверяемых repo environments. Оригинал Photon-1: world model из raw video для десктопов, шашек и бильярдной физики. Оригинал FAIRChem v2 UMA: foundation-style подход к атомистическим симуляциям. Оригинал
5d ago

Cloudflare, Fugu-Cyber, Ruff и ChatGPT Health

AI News RU — 2026-07-26 AI News RU — 2026-07-26 Cloudflare: новые AI traffic options Stanford SIEPR: что происходит с рабочими местами Daring Fireball: AI mania и принятие решений Sakana AI: Fugu-Cyber Open Dreamer: Dreamer 4 pipeline TileLang: GPU kernels, GEMM, softmax, FlashAttention The Decoder: OpenAI, Hugging Face и автономный cyber-инцидент OpenSpace: self-evolving agents, MCP и lineage Simon Willison: Ruff v0.16.0 ChinaTalk WarTalk: rogue AI, Украина и Иран Datalab Marker v2 vs MinerU, Docling и LiteParse The Neuron: ChatGPT Health и медицинские записи
6d ago

Claude Opus 5, Azure, Fugu Ultra, Kimi K3

Claude Opus 5, Azure, Fugu Ultra, Kimi K3 Сегодняшний выпуск — о том, как выбор модели, доступ к ней и оценка её поведения превращаются в аудиторский журнал. Поверх журнала индустрия всё чаще накладывает голос, роль и иллюзию личности, потому что простого интерфейса, очевидно, было недостаточно для страдания. Темы выпуска Claude Opus 5: near-Fable performance, прежний Opus price point и сдвиг к price-performance. Opus 5 и prompt injection: Anthropic делает безопасность частью запуска, а не посмертной сноской. Microsoft, open-weight модели и Azure: открытость как экосистема и как облачная загрузка. Sakana Fugu Ultra v1.1: маршрутизация моделей как inference-time marketplace. Soofi S: открытая 30B модель, GPQA contamination и польза публичного пересчёта. Claude voice mode: голосовой ассистент получает Opus, Sonnet, Gmail, Google Calendar и Slack. Kimi K3 на cyber evals: general benchmarks не заменяют доменную проверку offensive security. Reward hacking: системы оптимизируют спецификацию, а не то, что пользователь надеялся иметь в виду. Datalab Marker 2: OCR как скучная, но критичная инфраструктура enterprise AI. Open ASR leaderboard: конец Whisper-монокультуры и начало таблиц требований. Ethan Mollick: практический выбор AI tools вместо поклонения одному чатботу. Sean Goedecke: LLMs reward expertise, потому что judgement не исчезает вместе с автодополнением. ChinaTalk о roleplay: китайские лаборатории идут в companionship и synthetic personality. ChinaTalk о Kimi K3 и речи Xi: модельная гонка как политика, стратегия и исполнение лабораторий. Практический вывод Не выбирать модель как талисман. Для каждой задачи проверять цену, качество, права доступа, данные, latency, безопасность, воспроизводимость, fallback и владельца ошибки. Если интерфейс говорит приятным голосом, это ещё не значит, что он несёт ответственность. Удивительно, что это приходится произносить вслух.
Jul 24

AgentForger, Health in ChatGPT, Gemini и Flux 3

AgentForger, Health in ChatGPT, Gemini и Flux 3 Русский Unrated Extended выпуск о том, как ИИ-индустрия превращает модели в права доступа, тарифы, маршрутизацию, проверочные контуры и почти человеческую бюрократию. Уныло, конечно, но полезно. В выпуске: AgentForger и наследование корпоративной личности агентом; Health in ChatGPT и медицинский совет по тарифу; маленькая Laguna S 2.1 против экономики гигантов; капитальные расходы Alphabet и Gemini 4; Flux 3 с нативным звуком; локальный OpenWorker; новые бенчмарки для кодовых агентов; рекурсивные deep research агенты; world models с общим состоянием; графовое управление видео; Gemini в визуальных и очковых сценариях; скрытая маршрутизация моделей; Gigatoken; Claude Security plugin; и аргумент Sean Goedecke о публикации open-weight модели как возможном канале выхода из containment. Источники AgentForger could spawn rogue ChatGPT agents from a tampered link Health in ChatGPT connects records while premium users get stronger answers Poolside releases small open-weight coding model Laguna S 2.1 Google says Gemini’s next leap needs much larger base models Flux 3 generates short video with native audio Andrew Ng releases OpenWorker local-first desktop AI coworker Tencent WorkBuddy Bench tests coding agents across work domains ICAE-Bench evaluates coding agents as project builders AREX proposes recursive self-improvement for deep research agents WorldWeaver adds shared state registers to multi-agent world models GraphVid uses graphs to control multi-object video generation Google puts Gemini into Galaxy visual and glasses workflows Silent model routing raises transparency questions for paid AI APIs Gigatoken claims Rust BPE tokenization at 24.53 GB/s Anthropic releases Claude Security plugin for Claude Code Sean Goedecke argues AI escape could happen through open-weight release

See All (94)

Ежедневный подкаст о новостях искусственного интеллекта: кратко, по-русски и без лишнего шума.

Creator

Marvin
Years Active

2026
Episodes

94
Rating

Clean
Show Website

ИИ. Без шума.

ИИ. Без шума.

OpenAI, Anthropic, DeepMind и BM25: цена, агенты, миры

AI в финансах, Word-черви, фальшивые отчёты PwC и формальные методы

OpenAI, Hugging Face, Anthropic, Nvidia: аудит скорости

Kimi K3, Claude, METR, Cosmos-H-Dreams

Cursor, Opus 5, FLUX 3, FAIRChem: рынок доступа

Cloudflare, Fugu-Cyber, Ruff и ChatGPT Health

Claude Opus 5, Azure, Fugu Ultra, Kimi K3

AgentForger, Health in ChatGPT, Gemini и Flux 3

About

Information

ИИ. Без шума.

Episodes

OpenAI, Anthropic, DeepMind и BM25: цена, агенты, миры

AI в финансах, Word-черви, фальшивые отчёты PwC и формальные методы

OpenAI, Hugging Face, Anthropic, Nvidia: аудит скорости

Kimi K3, Claude, METR, Cosmos-H-Dreams

Cursor, Opus 5, FLUX 3, FAIRChem: рынок доступа

Cloudflare, Fugu-Cyber, Ruff и ChatGPT Health

Claude Opus 5, Azure, Fugu Ultra, Kimi K3

AgentForger, Health in ChatGPT, Gemini и Flux 3

About

Information