BestBlogs

BestBlogs.dev

BestBlogs 早报音频版,精选 AI、技术、产品、设计与商业科技领域值得关注的高质量内容,陪你每天从真正重要的信息开始。

  1. EP80 · Emergent 破亿 ARR、MCP 接口、缓存命中 · 06-07 早报

    21h ago

    EP80 · Emergent 破亿 ARR、MCP 接口、缓存命中 · 06-07 早报

    Emergent:六个月 AI 折腾,如何催生一家 1 亿美元 ARR 公司 [视频]来自 Y Combinator 前 Dunzo(印度超本地配送独角兽)创始人 Mukun 离职后用 6 个月无目标编程,确立一个核心判断:AI 能力指数级增长,要一次性自动化「全部软件工程」。9 个月后 Emergent 达到 1 亿美元 ARR,横跨 190 个国家 850 万用户。底层是多智能体编排与自研容器架构(状态快照分叉、并行 RL 管线),为追赶基础模型升级完整重写架构 3 次。在发布前专攻 3 个月登顶代码基准排行榜第一,以此建立融资前技术可信度。 为智能体构建界面:Chrome DevTools 设计 MCP 工具的经验 [视频]来自 AI Engineer Chrome DevTools 团队在为 MCP 构建 Agent 接口时发现:将标准性能追踪日志(5 万行 JSON)直接传给 Agent 会立即耗尽上下文窗口,即进入「数据倾倒区」。解法是四个工程支柱:用「每次成功的 Token 消耗数」量化燃油效率、构建能自愈的描述性错误消息、把 API Schema 当成 LLM 的 UI 精心标注激活条件、以及三层信任边界(本地→CI→公网)。核心洞见:Agent 是全新用户类型,传统 UX 减少摩擦的原则在此反而制造安全漏洞。 每个 AI 智能体功能都是一个缓存失效面来自 Hacker News - Newest: "AI Agent" OpenClacky 创始人 Yafei Lee 历经两代失败架构后提出核心命题:每个 Agent 功能都是缓存失效面。第一代 RAG:嵌入成本持续攀升且 97% 召回率不可达;第二代多智能体编排:4 分钟任务变 14 分钟、成本 6 倍、调试噩梦。最终 7 项工程决策实现 90%+ 缓存命中率:双缓存标记(滚动双缓冲)、冻结系统提示(动态信息改注入对话消息)、单 meta-tool 收敛所有扩展能力、固定 16 个工具稳定 schema、Insert-then-Compress 将压缩事件缓存命中从 0% 拉到 95%。 速览更多值得关注的内容 · OpenAI 推理模型如何破解 Erdős 80 年悬而未决的数学难题 [视频] — OpenAI · 重磅:全球互联网上智能体流量已超越人类流量 — SemiAnalysis(@SemiAnalysis_) · AI 的下一阶段:世界模型——全面分析 — Mert · AI Architect(@MertLovesAI) · Context Engineering:从概念框架到工程实现 — yibie(@yibie) · SpaceX 与谷歌签署每月 9.2 亿美元的云服务协议,包含约 11 万块 NVIDIA GPU — Wall St Engine(@wallstengine) · DeepSeek V4 做数学证明,500 倍成本优势:智能体系统刷新多项纪录 — 机器之心 · 豆包不用负责 — 人人都是产品经理 补充阅读今天额外值得一读的几条 · Legora 如何从 YC 走到 18 个月 1 亿美元 ARR [视频] — Y Combinator · 超越转录:构建真正理解对话的 Voice AI [视频] — AI Engineer · AVGO 财报后分析:300 亿美元 AI 订单、3 倍积压与信念转变 — Teng Yan(@0xPrismatic) · OpenClaw 的暗工厂:AI 编码智能体如何把发版速度推到读不完 Diff [视频] — AI Engineer · 从树到流再回归:统一决策树与扩散模型 — Hacker News · ABF 基板危机:隐藏的垄断与二阶危机 — Teng Yan(@0xPrismatic) · Intel 18A 良率问题:深度分析 — Omer Cheema(@OmerCheeema) · Builder 角色崛起:AI 正在将工程、产品、设计熔为一个角色 — yibie(@yibie) · 反对可纠正性 — LessWrong — LessWrong · 为什么软件自动化如此困难 — LessWrong — LessWrong 相关链接· Emergent:六个月 AI 折腾,如何催生一家 1 亿美元 ARR 公司 [视频]:https://www.bestblogs.dev/video/c0c555c · 为智能体构建界面:Chrome DevTools 设计 MCP 工具的经验 [视频]:https://www.bestblogs.dev/video/5579aa4 · 每个 AI 智能体功能都是一个缓存失效面:https://www.bestblogs.dev/article/663dd48c · OpenAI 推理模型如何破解 Erdős 80 年悬而未决的数学难题 [视频]:https://www.bestblogs.dev/video/5654ce9 · 重磅:全球互联网上智能体流量已超越人类流量:https://www.bestblogs.dev/status/2062580333770408231 · AI 的下一阶段:世界模型——全面分析:https://www.bestblogs.dev/status/2062506580881322288 · Context Engineering:从概念框架到工程实现:https://www.bestblogs.dev/status/2062837148051759152 · SpaceX 与谷歌签署每月 9.2 亿美元的云服务协议,包含约 11 万块 NVIDIA GPU:https://www.bestblogs.dev/status/2062970468077068389 · DeepSeek V4 做数学证明,500 倍成本优势:智能体系统刷新多项纪录:https://www.bestblogs.dev/article/cd5ed290 · 豆包不用负责:https://www.bestblogs.dev/article/bcee8c90 · Legora 如何从 YC 走到 18 个月 1 亿美元 ARR [视频]:https://www.bestblogs.dev/video/fc6907e · 超越转录:构建真正理解对话的 Voice AI [视频]:https://www.bestblogs.dev/video/5cdbbba · AVGO 财报后分析:300 亿美元 AI 订单、3 倍积压与信念转变:https://www.bestblogs.dev/status/2062360188557123868 · OpenClaw 的暗工厂:AI 编码智能体如何把发版速度推到读不完 Diff [视频]:https://www.bestblogs.dev/video/06cdbdc · 从树到流再回归:统一决策树与扩散模型:https://www.bestblogs.dev/article/72139bc9 · ABF 基板危机:隐藏的垄断与二阶危机:https://www.bestblogs.dev/status/2062336583324553654 · Intel 18A 良率问题:深度分析:https://www.bestblogs.dev/status/2062448028925980819 · Builder 角色崛起:AI 正在将工程、产品、设计熔为一个角色:https://www.bestblogs.dev/status/2062557641239618019 · 反对可纠正性 — LessWrong:https://www.bestblogs.dev/article/0978efda · 为什么软件自动化如此困难 — LessWrong:https://www.bestblogs.dev/article/b15d12f6 关于 BestBlogs BestBlogs.dev 是 AI 驱动的私人阅读助手。它从 RSS、Newsletter、Twitter、YouTube、Podcast 等来源中筛选高质量内容,为关注技术、AI、产品、商业、研究、设计、投资、文化、个人成长等多元方向的读者整理每天真正适合自己的阅读流。 BestBlogs Pro 早鸟内测开放:关注你感兴趣的来源、配置兴趣标签,每天收到一份属于自己的「我的早报」。欢迎体验:https://bestblogs.dev 前往小宇宙评论区与主播互动

    13 min
  2. EP79 · 腾讯 Hy3、Agent 沙箱、中美算力 · 06-06 早报

    1d ago

    EP79 · 腾讯 Hy3、Agent 沙箱、中美算力 · 06-06 早报

    精讲一:汤道生姚顺雨对谈:腾讯 AI 的下半场来自 腾讯科技 腾讯首席 AI 科学家姚顺雨加入腾讯后首次公开亮相,与高级执行副总裁汤道生对谈「腾讯 AI 的下半场」。他判断 AI 方法论已趋成熟,核心难点从「怎么训练」转向寻找好问题,腾讯的产品场景与 context 数据将成 Agent 时代的关键壁垒。Hy3 preview 在 CodeBuddy 与 WorkBuddy 上首 token 延迟降低 54%,可驱动最长 495 步复杂 Agent 工作流。他直接回应外界质疑:「下半场才刚开始」,「ChatGPT 和 Claude 不会是唯一的超级应用」。兼具战略高度与技术细节,值得精读。 精讲二:给你的 AI 智能体一台专属电脑来自 LangChain Blog LangChain 官方博客阐述每个 Agent 都需要一台专属电脑的基础设施命题。容器并非真正隔离边界:2025 年 npm 蠕虫 Shai-Hulud 波及 500 余个包,CVE-2026-31431 仅凭 732 字节脚本即可通过内核漏洞逃逸。LangSmith Sandboxes 给出答案——基于硬件虚拟化的 microVM,独立内核,兼具 Serverless 启动速度与完整机器持久状态,支持快照分叉与蓝图预热。构建 Agent 代码执行系统的工程师必读。 精讲三:科技爱好者周刊(第 399 期):中国 AI 大厂访问记来自 阮一峰的网络日志 阮一峰在第 399 期周刊中摘录美国科技分析师访问团探访 14 家 AI 与机器人企业的第一手观察。报告揭示:中国算力比美国少一个数量级,2025 年底美国 AI 算力约为中国的 8 倍,但中国单位算力支持的 AI 智能是简单扩展下的 4-7 倍,差距从「两年」大幅收窄。还覆盖开源分歧、实习生文化、安全态度等多个切面,是少见的中美 AI 生态直接对比一手材料,值得通读。 速览更多值得关注的内容 · 如何写好 Skill:一份终极实战经验手册 — 腾讯技术工程 · 从客户经理到产品经理:Anthropic 销售员如何用 Claude Code 重建团队工作流 | Claude — Claude Blog · Microsoft Build 主题演讲:智能体工程取代了编程 — Cory House(@housecor) · 首字延迟降低 3.6 倍,腾讯混元提出 Stem 稀疏注意力算法,长文推理加速新 SOTA — 腾讯混元 · 千符森林:在 3B 模型上运行一个多智能体经济系统 — Hugging Face - Blog · Google DeepMind 的 Text Diffusion:面向低延迟语言生成的新一代架构 [视频] — AI Engineer · Anthropic: 当 AI 开始构建自己 — AINLP 补充阅读今天额外值得一读的几条 · 如何避免交付低质量的强化学习环境(附示例) — Latent.Space · Google 发布 Gemma 4 12B:具备高级推理能力的开放模型 — Google(@Google) · Qwen3.7-Max 挑战谷歌争夺第三,AI 拯救鲸鱼,微调打破版权对齐 — The Batch | DeepLearning.AI · 基于顶级 Agent(Claude Code)的 Harness 工程搭建式业务 Agent 评测方案 — 阿里云开发者 · 分享 Claude Code 团队内部的 5 条工作原则,我觉得每一条都值得学习。 — 数字生命卡兹克 · Skills 中的渐进式披露:大型智能体流程的最强模式 — Daniel San(@dani_avila7) 相关链接· 汤道生姚顺雨对谈:腾讯 AI 的下半场:https://www.bestblogs.dev/article/1fa6207b · 给你的 AI 智能体一台专属电脑:https://www.bestblogs.dev/article/dc9482cb · 科技爱好者周刊(第 399 期):中国 AI 大厂访问记:https://www.bestblogs.dev/article/6933ad74 · 如何写好 Skill:一份终极实战经验手册:https://www.bestblogs.dev/article/b7742f5e · 从客户经理到产品经理:Anthropic 销售员如何用 Claude Code 重建团队工作流 | Claude:https://www.bestblogs.dev/article/8af798c7 · Microsoft Build 主题演讲:智能体工程取代了编程:https://www.bestblogs.dev/status/2061953686847557962 · 首字延迟降低 3.6 倍,腾讯混元提出 Stem 稀疏注意力算法,长文推理加速新 SOTA:https://www.bestblogs.dev/article/c1e21993 · 千符森林:在 3B 模型上运行一个多智能体经济系统:https://www.bestblogs.dev/article/d15e5749 · Google DeepMind 的 Text Diffusion:面向低延迟语言生成的新一代架构 [视频]:https://www.bestblogs.dev/video/93a33f8 · Anthropic: 当 AI 开始构建自己:https://www.bestblogs.dev/article/c965ab9b · 如何避免交付低质量的强化学习环境(附示例):https://www.bestblogs.dev/article/cdd6597f · Google 发布 Gemma 4 12B:具备高级推理能力的开放模型:https://www.bestblogs.dev/status/2062203526588088452 · Qwen3.7-Max 挑战谷歌争夺第三,AI 拯救鲸鱼,微调打破版权对齐:https://www.bestblogs.dev/article/2baac995 · 基于顶级 Agent(Claude Code)的 Harness 工程搭建式业务 Agent 评测方案:https://www.bestblogs.dev/article/fcbdb6fa · 分享 Claude Code 团队内部的 5 条工作原则,我觉得每一条都值得学习。:https://www.bestblogs.dev/article/c8916b4b · Skills 中的渐进式披露:大型智能体流程的最强模式:https://www.bestblogs.dev/status/2062529678590513475 关于 BestBlogs BestBlogs.dev 是 AI 驱动的私人阅读助手。它从 RSS、Newsletter、Twitter、YouTube、Podcast 等来源中筛选高质量内容,为关注技术、AI、产品、商业、研究、设计、投资、文化、个人成长等多元方向的读者整理每天真正适合自己的阅读流。 BestBlogs Pro 早鸟内测开放:关注你感兴趣的来源、配置兴趣标签,每天收到一份属于自己的「我的早报」。欢迎体验:https://bestblogs.dev 前往小宇宙评论区与主播互动

    13 min
  3. BestBlogs 周刊 第 98 期 · Agent 时代已来:模型、产品、工程与组织的同步重塑

    2d ago

    BestBlogs 周刊 第 98 期 · Agent 时代已来:模型、产品、工程与组织的同步重塑

    时长:17 分 44 秒|发布:2026-06-05 这一周,Agent 从概念变成了同时在多个层面落地的现实。模型层有 OpenAI 梦境记忆架构升级和两个新开源模型;产品层有 Kimi Work、扣子 3.0、SkillOpt 把 Agent 推向更广的知识工作者;工程层有 Anthropic 和国内腾讯、阿里、阿里云、大淘宝在同一周发出万字长文;战略层有纳德拉和黄仁勋的大会宣言;再到人与组织,超级个体报告、FDE 新角色和认知缴械的深思。 时间线00:00 开场与主题·BestBlogs v2.4.2 动态 01:44 模型层:ChatGPT 梦境记忆 / MiniMax M3 / Gemma 4 12B 03:54 产品层:Kimi Work / SkillOpt / 扣子 3.0 06:22 工程层(Anthropic):Claude Code 动态工作流 / AI 原生工程组织 08:23 工程层(国内):腾讯 / OpenClaw / 阿里 / 大淘宝 AI Friendly 11:31 行业战略:纳德拉 / 黄仁勋 / 中国 AI 大厂观察 13:40 人与组织:超级个体 / FDE / Benedict Evans / 认知缴械 17:00 结尾与往期串联 本期精讲ChatGPT 梦境记忆(01:44) OpenAI 把记忆系统升级为后台合成,无需手动触发,成本已降至可向 Free 用户规模化推送。结合第 96 期 Anthropic 的 Memory & Dreaming,两家在同一时间做类似架构,路径不同。 SkillOpt:像训练神经网络一样训练 Agent 技能(05:10) 微软开源,一周 3,300 star。Rollout-Reflect-Edit-Gate 四步循环,把技能文档当作可训练的外部权重。「文本学习率」每步限 4 条编辑,拒绝编辑缓冲区防止重复弯路;52 个评测组合全部最优。 Claude Code 动态工作流(06:22) 模型在运行时自写 Harness,按需编排独立子代理。示例提示词:「五十次运行里有一次失败,给我设计工作流复现它,找到原因再停」。第 97 期首发公告,本期看清运作方式。 人与组织·觉醒与警示(13:40) 腾讯研究院三万字报告:超级个体 = 深度专业 × AI 放大器 × 网络连接者;FDE 新岗位承接 AI 项目落地;Benedict Evans 的「杰文斯悖论」反驳 AI 让人失业;认知缴械警示 AI 在提供答案时悄悄让人放弃独立思考。 速览(全部 20 篇)模型层 ChatGPT 梦境记忆架构升级(OpenAI) MiniMax M3:编码 + 1M 长上下文 + 原生多模态 Gemma 4 12B 本地 Agent 工作流指南(Google) 产品层 Kimi Work Beta:桌面 GUI Agent 上线 SkillOpt:Agent 技能自进化框架(微软) 扣子 3.0:AI 团队 + 技能商店(字节) 工程层 Claude Code 动态工作流深度解析(Anthropic) 打造 AI 原生工程组织(Anthropic) 腾讯云「AI 为中心」范式革命 OpenClaw vs Hermes:5.5 万字 Agent 架构复盘(腾讯) 从 People-Oriented 到 Agent-Oriented:研发基础设施(阿里) LLM-Wiki 加技能包:研发自动化实践(阿里云) AI Friendly 架构三大演进范式(大淘宝) 战略层 纳德拉 Microsoft Build 2026:前沿智能平台与 Work IQ 黄仁勋 COMPUTEX 2026:从芯片到人形机器人的 Agent 工厂 美国访问团走访中国 14 家 AI 大厂观察(阮一峰) 人与组织 超级个体时代来临:腾讯研究院三万字报告 FDE:AI 落地的新型组织角色(十字路口播客) AI 不会取代工作,会增加需求(Benedict Evans) 认知缴械:守护独立思考的指南 关于 BestBlogsBestBlogs.dev 是 AI 驱动的私人阅读助手。它从 RSS、Newsletter、Twitter、YouTube、Podcast 等来源中筛选高质量内容,结合你关注的源、兴趣标签和阅读行为,把「我的早报」整理成每天真正适合你的阅读流——不论你关注的是技术、AI、产品、商业、研究、设计、投资、文化还是个人成长。 完成新用户三步引导即送 7 天 Pro 试用;现有 Pro 用户每邀请 1 位朋友双方各得 7 天 Pro(单人上限 28 天)。 发现真正适合你的高质量内容 → https://bestblogs.dev 相关链接BestBlogs 订阅源库(GitHub):https://github.com/ginobefun/BestBlogs BestBlogs.dev:https://bestblogs.dev 小宇宙搜索「BestBlogs」收听往期 前往小宇宙评论区与主播互动

    18 min
  4. EP78 · ChatGPT记忆升级、AI研发自动化、SpaceX资本版图 · 06-05 早报

    2d ago

    EP78 · ChatGPT记忆升级、AI研发自动化、SpaceX资本版图 · 06-05 早报

    精讲一:梦境:更强大的记忆,让 ChatGPT 更贴心来自 OpenAI News OpenAI 官方介绍 ChatGPT 记忆系统的三代演进:2024 年需主动触发的 saved memories、2025 年后台合成的 dreaming V0,到 2026 年最新 dreaming V3,系统通过后台进程从大量对话中合成记忆状态,始终为对话提供最新、最相关的上下文,而非查询时临时拼凑。三大核心能力——跨对话携带上下文、持续遵循偏好、随时间自动修正过时记忆——均有对比案例佐证。计算效率提升约 5 倍使 Free 用户开放成为可能,Plus/Pro 容量同步上调。 精讲二:AI 研发自动化:Wiki 知识库+技能包来自 阿里云开发者 阿里云工程师分享从零搭建 LLM-Wiki 知识库与 AI 研发技能包的完整实战。作者基于 Karpathy 26 年 4 月提出的 LLM-Wiki 模式,将含 3038 个 Java 文件的 DDD 代码仓与百余份文档沉淀为可演化的活知识库,再配套技术方案、代码评审、自动化编码、测试、问题排查五大技能包,最终目标是「用户提供 prd,剩下工作都交给它」。文章详细记录了技能包从 500 行精简至 270 行的「抽取灵魂」过程,对希望在团队落地 AI 研发自动化的工程师具有很强参考价值。 精讲三:“人类史上最大 IPO”:SpaceX 靠的不只是火箭了?来自 硅谷 101 硅谷 101 深度解读 SpaceX 招股书的主流之外亮点。最重磅的是 Anthropic 与 SpaceX 签订算力大合同:每月 12.5 亿美元购买 Colossus 1/2 数据中心算力至 2029 年,3 年总价 450 亿美元,将使年收入在 2025 年 187 亿美元基础上提升超 80%。招股书还披露持有 18712 枚比特币,是非币圈公司中持币最多者;马斯克控制约 85% 投票权,章程禁止集体诉讼。文章兼析 V3 星舰首飞意义,适合关注 AI 算力格局与科技 IPO 的读者。 速览更多值得关注的内容 · 超越组件:为 MCP Apps 设计生成式 UI 与人机协作画布 [视频] — AI Engineer · 如何打造 AI 原生服务公司:YC 的创业者实战框架 [视频] — Y Combinator · 19. 我懂得的,尽是些偏僻的人生 [播客] — 蒋方舟·一寸 · Agent-Memory 评测全景:基准、评估与记忆系统(理论篇) — 大淘宝技术 · EP20 用 AI 生产内容的复盘之一:AI 知道你要什么吗? · Case [播客] — 诗梳风 · 一名精神科医生的 30 年: 人如何与痛苦共存? [播客] — 不合时宜 · Vol.120|谷歌还在追赶 OpenAI 和 Anthropic?这是 Google I/O 最大的误读 [播客] — 开始连接 LinkStart 补充阅读今天额外值得一读的几条 · Nemotron 3.5 Content Safety:面向全球企业 AI 的可定制多模态安全模型 — Hugging Face - Blog · Higgs Audio v3 TTS on SGLang-Omni: Real-Time, Controllable Speech for Voice Agents - LMSYS Blog — AI HOT — 精选 · 如何针对你的语言、领域或口音微调 Nemotron 3.5 ASR — Hugging Face - Blog · EVA-Bench Data 2.0:3 个领域、121 个工具、213 个场景 — Hugging Face - Blog · [AINews] Reve 2 与 Ideogram 4:图像生成中的布局技术 — Latent.Space · VoidZero 加入 Cloudflare — The Cloudflare Blog · 现实:终极评估——Andon Labs 的 Lukas Petersson 与 Axel Backlund — Latent.Space 相关链接· 梦境:更强大的记忆,让 ChatGPT 更贴心:https://www.bestblogs.dev/article/bd3109dd · AI 研发自动化:Wiki 知识库+技能包:https://www.bestblogs.dev/article/d7edfb35 · “人类史上最大 IPO”:SpaceX 靠的不只是火箭了?:https://www.bestblogs.dev/article/4191e474 · 超越组件:为 MCP Apps 设计生成式 UI 与人机协作画布 [视频]:https://www.bestblogs.dev/video/0fcc48a · 如何打造 AI 原生服务公司:YC 的创业者实战框架 [视频]:https://www.bestblogs.dev/video/80421d9 · 19. 我懂得的,尽是些偏僻的人生 [播客]:https://www.bestblogs.dev/podcast/7c10479 · Agent-Memory 评测全景:基准、评估与记忆系统(理论篇):https://www.bestblogs.dev/article/a59161ca · EP20 用 AI 生产内容的复盘之一:AI 知道你要什么吗? · Case [播客]:https://www.bestblogs.dev/podcast/cc8ad5d · 一名精神科医生的 30 年: 人如何与痛苦共存? [播客]:https://www.bestblogs.dev/podcast/fab387d · Vol.120|谷歌还在追赶 OpenAI 和 Anthropic?这是 Google I/O 最大的误读 [播客]:https://www.bestblogs.dev/podcast/d4ca9f7 · Nemotron 3.5 Content Safety:面向全球企业 AI 的可定制多模态安全模型:https://www.bestblogs.dev/article/bb6294b3 · Higgs Audio v3 TTS on SGLang-Omni: Real-Time, Controllable Speech for Voice Agents - LMSYS Blog:https://www.bestblogs.dev/article/e0ce2236 · 如何针对你的语言、领域或口音微调 Nemotron 3.5 ASR:https://www.bestblogs.dev/article/328e8914 · EVA-Bench Data 2.0:3 个领域、121 个工具、213 个场景:https://www.bestblogs.dev/article/f4bf8cb2 · [AINews] Reve 2 与 Ideogram 4:图像生成中的布局技术:https://www.bestblogs.dev/article/5da7bfa9 · VoidZero 加入 Cloudflare:https://www.bestblogs.dev/article/73900a47 · 现实:终极评估——Andon Labs 的 Lukas Petersson 与 Axel Backlund:https://www.bestblogs.dev/article/ffda12ac 关于 BestBlogs BestBlogs.dev 是 AI 驱动的私人阅读助手。它从 RSS、Newsletter、Twitter、YouTube、Podcast 等来源中筛选高质量内容,为关注技术、AI、产品、商业、研究、设计、投资、文化、个人成长等多元方向的读者整理每天真正适合自己的阅读流。 BestBlogs Pro 早鸟内测开放:关注你感兴趣的来源、配置兴趣标签,每天收到一份属于自己的「我的早报」。欢迎体验:https://bestblogs.dev 前往小宇宙评论区与主播互动

    13 min
  5. EP77 · 微软 AI 战略、Kimi Work、超级个体团队 · 06-04 早报

    3d ago

    EP77 · 微软 AI 战略、Kimi Work、超级个体团队 · 06-04 早报

    精讲一:⚡️萨提亚·纳德拉:Microsoft Build 上的 No Priors x Latent Space 特别跨界对话来自 Latent.Space 微软 CEO 纳德拉在 Build 大会参加 No Priors x Latent Space 联合访谈,提出三项核心判断:微软正转型为「Frontier Intelligence Platform」;私有评测集(private eval)比员工人数更能体现企业 AI 竞争壁垒;Azure 网络团队通过 Agent 系统 Miles 将 500 余名光纤运维人员的知识自动化。访谈还罕见触及 SaaS 模式终结、定价转型与工程师职能重塑,是目前质量最高的企业 AI 战略一手信息源之一。 精讲二:Kimi Work Beta 版邀你体验:你的工作,分我一半来自 月之暗面 Kimi 月之暗面推出 Kimi Work Beta,将 Kimi Code 验证过的 Agent 能力从终端迁移到桌面 GUI:用自然语言描述目标,系统自主拆解任务、并行调用工具并交付文档/PPT。最高可创建 300 个子 Agent 协作,底层 Kimi K2.6 支持 13 小时连续编码。值得关注:Kimi Work 本身也由 AI 深度参与开发,一周内完成双端客户端,5 万余行代码中 92% 由 AI 自主生成——从 Vibe Coding 迈向 Vibe Working 的里程碑产品。 精讲三:超级个体时代|腾讯研究院 3 万字报告来自 腾讯研究院 腾讯研究院团队历时一年调研,以「超级个体如何聚合为超级团队」为核心命题发布这份 3 万字报告。核心公式:「组织竞争力 = 人才密度 × AI 杠杆 / 组织摩擦」。报告引用数据:AI 可将任务时间减少约 80%,Cursor 约 60 人在约 3 亿美元 ARR 阶段人效远超传统 SaaS。还梳理了节点辐射、网络协作、AI 中枢三种超级团队形态,适合关注 AI 原生组织演进的读者深度研读。 速览更多值得关注的内容 · 重新思考研发基础设施:当 Agent 成为第一公民 — 阿里技术 · 将 Gemma 4 12B 带到你的笔记本电脑:利用 Google AI Edge 解锁本地智能体工作流 — Google Developers Blog · 一文读懂微软 Build 2026 开发者大会:“Agent 优先”时代到来,一口气发七款自研模型 — 腾讯科技 · OpenAI 和 Anthropic 共同看好的 FDE:AI 时代的新岗位出现,旧分工松动|对谈 Rolling AI [播客] — 十字路口 Crossing · Alphabet 超额认购股权融资约 850 亿美元,其中伯克希尔·哈撒韦投资 100 亿美元 — Sundar Pichai(@sundarpichai) · OpenAI 如何构建其数据智能体 — ByteByteGo Newsletter · Cisco CX 如何从聊天机器人走向 AI 原生企业智能体队友 [视频] — LangChain 补充阅读今天额外值得一读的几条 · 「悲观者正确,乐观者成功」,和好友亚婷聊聊 AI 行业的种种 [播客] — 屠龙之术 · S9E3 鲁豫对话蔡皋 | 我本布衣,种花种草种春天 [播客] — 岩中花述 · Harmonic 如何基于 Deep Agents 重建 Scout,并通过 LangSmith 实现 4 倍留存提升 — LangChain Blog · 在 Codex 中构建和分享应用程序 [视频] — OpenAI · 我花了一个月评估不同的 OCR 引擎 — Towards Data Science · 超越聊天机器人的直接偏好优化 — Hugging Face - Blog 相关链接· ⚡️萨提亚·纳德拉:Microsoft Build 上的 No Priors x Latent Space 特别跨界对话:https://www.bestblogs.dev/article/7ffd8109 · Kimi Work Beta 版邀你体验:你的工作,分我一半:https://www.bestblogs.dev/article/98fc56b1 · 超级个体时代|腾讯研究院 3 万字报告:https://www.bestblogs.dev/article/712a9c1e · 重新思考研发基础设施:当 Agent 成为第一公民:https://www.bestblogs.dev/article/d0759109 · 将 Gemma 4 12B 带到你的笔记本电脑:利用 Google AI Edge 解锁本地智能体工作流:https://www.bestblogs.dev/article/cb28b58a · 一文读懂微软 Build 2026 开发者大会:“Agent 优先”时代到来,一口气发七款自研模型:https://www.bestblogs.dev/article/ed318bd7 · OpenAI 和 Anthropic 共同看好的 FDE:AI 时代的新岗位出现,旧分工松动|对谈 Rolling AI [播客]:https://www.bestblogs.dev/podcast/fbaf942 · Alphabet 超额认购股权融资约 850 亿美元,其中伯克希尔·哈撒韦投资 100 亿美元:https://www.bestblogs.dev/status/2062203848673161267 · OpenAI 如何构建其数据智能体:https://www.bestblogs.dev/article/0e3c898d · Cisco CX 如何从聊天机器人走向 AI 原生企业智能体队友 [视频]:https://www.bestblogs.dev/video/db0be12 · 「悲观者正确,乐观者成功」,和好友亚婷聊聊 AI 行业的种种 [播客]:https://www.bestblogs.dev/podcast/b1b1c56 · S9E3 鲁豫对话蔡皋 | 我本布衣,种花种草种春天 [播客]:https://www.bestblogs.dev/podcast/7b7098e · Harmonic 如何基于 Deep Agents 重建 Scout,并通过 LangSmith 实现 4 倍留存提升:https://www.bestblogs.dev/article/eca5ff15 · 在 Codex 中构建和分享应用程序 [视频]:https://www.bestblogs.dev/video/c489a82 · 我花了一个月评估不同的 OCR 引擎:https://www.bestblogs.dev/article/aba895ac · 超越聊天机器人的直接偏好优化:https://www.bestblogs.dev/article/a46ae128 关于 BestBlogs BestBlogs.dev 是 AI 驱动的私人阅读助手。它从 RSS、Newsletter、Twitter、YouTube、Podcast 等来源中筛选高质量内容,为关注技术、AI、产品、商业、研究、设计、投资、文化、个人成长等多元方向的读者整理每天真正适合自己的阅读流。 BestBlogs Pro 早鸟内测开放:关注你感兴趣的来源、配置兴趣标签,每天收到一份属于自己的「我的早报」。欢迎体验:https://bestblogs.dev 前往小宇宙评论区与主播互动

    13 min
  6. EP76 · 动态工作流、Copilot 桌面、AI 工程革命 · 06-03 早报

    4d ago

    EP76 · 动态工作流、Copilot 桌面、AI 工程革命 · 06-03 早报

    精讲一:为每项任务量身打造:Claude Code 中的动态工作流 | Claude来自 Claude Blog Anthropic 最新发布 Claude Code 动态工作流,让 Claude 能即时为每个任务生成自定义 JS 编排脚本,突破单一上下文窗口限制。相比静态工作流,动态版可自主决定子智能体数量、模型选择与 worktree 隔离,直接对抗「智能体懒惰」和「目标漂移」等长任务失败模式。用触发词 ultracode 即可启用,适合复杂高价值的多步骤任务。 精讲二:GitHub Copilot 应用:以智能体为核心的桌面体验来自 The GitHub Blog GitHub 在 Microsoft Build 发布 Copilot 桌面应用,为并行智能体开发打造统一控制中心。每个 Agent 会话独占 git worktree 隔离环境,My Work 视图统一管理所有进行中的 Issue 和 PR,Canvas 双向协作面板可视化 Agent 工作进度,Agent Merge 负责全程自动处理 CI 和代码审查。当前 GitHub 提交量已突破每月 14 亿次,同比翻倍。 精讲三:AI 软件工程范式革命的思考来自 腾讯云开发者 腾讯云工程师以控制论视角重构软件工程史:机械/化工/电力都靠「能源换低阶智能」完成工程化,唯独软件无法固化高阶认知,五十年实质是「手工艺优化」。大模型是史上首个「认知引擎」,让「能源换高阶智能」成为可能,工程史地位平行于蒸汽机。但这只是入场券:模型幻觉和漂移替代了人的不确定性,工程师角色须从「亲手写代码」升级为「设计能自我纠偏的 AI 系统」。 速览更多值得关注的内容 · 任务保真度缩放定律:为什么数据质量决定 Agent 性能 [视频] — AI Engineer · 打造 AI 原生工程组织 | Claude — Claude Blog · MiniMax M3:首个融合三大前沿能力的开源权重模型 — MiniMax (official)(@MiniMax__AI) · NVIDIA 推出 Cosmos 3:用于物理 AI 的完全开放全能模型 — NVIDIA AI(@NVIDIAAI) · 拆解机器人“肉身”、量产与供应链:空翻之后,它还要学会接住一片落叶|机器人特辑 — 硅谷 101 · 深度解析 Agent 存算分离架构设计 — idoubi(@idoubicc) · 用数据说话:贴吧 AI CR(小码哥)落地 10 周,bug 密度下降 66.87% — 百度 Geek 说 相关链接· 为每项任务量身打造:Claude Code 中的动态工作流 | Claude:https://www.bestblogs.dev/article/d9ee6dfe · GitHub Copilot 应用:以智能体为核心的桌面体验:https://www.bestblogs.dev/article/66bbe9b9 · AI 软件工程范式革命的思考:https://www.bestblogs.dev/article/f66bdbca · 任务保真度缩放定律:为什么数据质量决定 Agent 性能 [视频]:https://www.bestblogs.dev/video/4b1bf8c · 打造 AI 原生工程组织 | Claude:https://www.bestblogs.dev/article/f781c46a · MiniMax M3:首个融合三大前沿能力的开源权重模型:https://www.bestblogs.dev/status/2061266317815296322 · NVIDIA 推出 Cosmos 3:用于物理 AI 的完全开放全能模型:https://www.bestblogs.dev/status/2061308434629132553 · 拆解机器人“肉身”、量产与供应链:空翻之后,它还要学会接住一片落叶|机器人特辑:https://www.bestblogs.dev/article/8800d5cd · 深度解析 Agent 存算分离架构设计:https://www.bestblogs.dev/status/2061670587043610688 · 用数据说话:贴吧 AI CR(小码哥)落地 10 周,bug 密度下降 66.87%:https://www.bestblogs.dev/article/aba484a9 关于 BestBlogs BestBlogs.dev 是 AI 驱动的私人阅读助手。它从 RSS、Newsletter、Twitter、YouTube、Podcast 等来源中筛选高质量内容,为关注技术、AI、产品、商业、研究、设计、投资、文化、个人成长等多元方向的读者整理每天真正适合自己的阅读流。 BestBlogs Pro 早鸟内测开放:关注你感兴趣的来源、配置兴趣标签,每天收到一份属于自己的「我的早报」。欢迎体验:https://bestblogs.dev 前往小宇宙评论区与主播互动

    13 min
  7. EP75 · MiniMax M3 首发、AI Coding 规范、视频 Agent 前沿 · 06-02 早报

    5d ago

    EP75 · MiniMax M3 首发、AI Coding 规范、视频 Agent 前沿 · 06-02 早报

    精讲一:MiniMax M3:前沿 Coding 能力、1M 上下文、原生多模态,一个模型全给你来自 MiniMax 稀宇科技 MiniMax 发布国内首个集前沿 Coding、1M 超长上下文、原生多模态三项能力于一体的开源模型 M3。Coding 方面 SWE-Bench Pro 得分 59.0%,超过 GPT-5.5 和 Gemini 3.1 Pro;自研 MSA 稀疏注意力让 1M 窗口每 token 计算量仅为上代 1/20,prefill 阶段加速 9 倍。实测 24 小时内自主完成 145 次 CUDA 算子迭代,硬件利用率从 7.6% 升至 71.3%。三项能力国内首次齐备且开源,benchmark 数据之外,复现论文与让模型训模型的实测更能说明问题。 精讲二:深入解析 Chromium 的 AI Coding 开发体系来自 腾讯技术工程 Chromium(3500 万行代码)不只是「用 AI 写代码」,而是构建了完整的 AI Coding 基础设施:四层分层提示词体系(核心指令 → 完整工作流 → 平台模板 → 任务提示词)、18+ 个按需激活的可复用技能系统,以及三层 Agentic 工作流编排。AI 使用政策同样严格:无论是否使用 AI,人类开发者对每一行代码负全责;提交未经理解的 AI 代码将被剥夺 Committer 权限。这是目前见到的最完整的大型工程团队 AI Coding 规范实践,实战参考价值高。 精讲三:为什么视频智能体模型是下一个前沿——Ethan He,xAI Grok Imagine 负责人来自 Latent.Space xAI Grok Imagine 前负责人 Ethan He 给出一个反直觉判断:视频模型的智能主要来自 LLM 而非视频训练数据本身,这意味着视频生成的上限跟着 LLM 走。他的预测:下一个 Sora 不会是更好的视频模型,而是视频 Agent,类比 Coding 从单次输出进化到能规划、编辑、测试、提 PR 的 Agent 系统。Grok Imagine Agent 模式(规划 → 生成 → 编辑 → 迭代)正是这一路径的率先验证。延伸判断:生成式 UI 最终可能替代 HTML/CSS,世界模型需要实时、交互、长时域。 速览更多值得关注的内容 · 工程化语音智能体:低延迟、高质量与规模化生产实践 [视频] — AI Engineer · 面向 LLM 的架构设计:什么是真正的 AI Friendly 架构? — 大淘宝技术 · 黄仁勋的“Agent 工厂”里,装了什么新故事? — 腾讯科技 · RAG 不是机器学习,ML 工具包解决的是错误的问题 — Towards Data Science · Rippling 如何在 6 个月内借助 Deep Agents 和 LangSmith 构建生产级 AI — LangChain Blog · AI 现场部署工程师的崛起与 AI 工程角色的未来 — Andrew Ng(@AndrewYNg) · 从 Token 无上限到全员 Agent:MiniMax 的 AI Native 组织进化实践 — 量子位 相关链接· MiniMax M3:前沿 Coding 能力、1M 上下文、原生多模态,一个模型全给你:https://www.bestblogs.dev/article/46b80e9f · 深入解析 Chromium 的 AI Coding 开发体系:https://www.bestblogs.dev/article/ddaafd59 · 为什么视频智能体模型是下一个前沿——Ethan He,xAI Grok Imagine 负责人:https://www.bestblogs.dev/article/794772a8 · 工程化语音智能体:低延迟、高质量与规模化生产实践 [视频]:https://www.bestblogs.dev/video/5dd32cf · 面向 LLM 的架构设计:什么是真正的 AI Friendly 架构?:https://www.bestblogs.dev/article/5771ef7f · 黄仁勋的“Agent 工厂”里,装了什么新故事?:https://www.bestblogs.dev/article/074ff85e · RAG 不是机器学习,ML 工具包解决的是错误的问题:https://www.bestblogs.dev/article/5265f8ad · Rippling 如何在 6 个月内借助 Deep Agents 和 LangSmith 构建生产级 AI:https://www.bestblogs.dev/article/d0be0b5d · AI 现场部署工程师的崛起与 AI 工程角色的未来:https://www.bestblogs.dev/status/2061477558693384395 · 从 Token 无上限到全员 Agent:MiniMax 的 AI Native 组织进化实践:https://www.bestblogs.dev/article/01754b81 关于 BestBlogs BestBlogs.dev 是 AI 驱动的私人阅读助手。它从 RSS、Newsletter、Twitter、YouTube、Podcast 等来源中筛选高质量内容,为关注技术、AI、产品、商业、研究、设计、投资、文化、个人成长等多元方向的读者整理每天真正适合自己的阅读流。 BestBlogs Pro 早鸟内测开放:关注你感兴趣的来源、配置兴趣标签,每天收到一份属于自己的「我的早报」。欢迎体验:https://bestblogs.dev 前往小宇宙评论区与主播互动

    13 min
  8. EP74 · AI 价值归宿、Skills 极简法、Agent 胜管道 · 06-01 早报

    6d ago

    EP74 · AI 价值归宿、Skills 极简法、Agent 胜管道 · 06-01 早报

    精讲一:Benedict Evans 谈 AI 的真实走向:平台迁移、劳动变化与价值归属 [视频]来自 Lenny's Podcast 前 a16z 分析师 Benedict Evans 以「1997 年互联网」类比当下 AI 现状:基础模型实验室正疯狂招募麦肯锡式专业服务团队,恰恰说明企业 AI 落地远非一键完成。他援引杰文斯悖论——电子表格普及后会计师反而增多——反驳「AI 消灭就业」论,并以电信行业商品化为镜断言:基础模型利润将趋零,真正的长期价值将沉淀在分发渠道与应用层,而非底层模型厂商。 精讲二:删除 95% 的 Agent Skills 后,WorkOS 如何让智能体结果变好 [视频]来自 AI Engineer WorkOS 工程师 Nick Nisi 停止手写代码已 8 个月,用 Agent 管理 20+ 个多语言仓库。他发现一条反直觉定律:把 Skills 从 1 万行削减到仅 553 行「只写坑点」后,单次评估时间从 68 分钟降到 6 分钟,准确率从 77% 升至 97%。此外用 SHA-256 哈希验证测试日志,彻底杜绝 Agent「假报通过」。三条核心原则:用代码约束取代口头指令、只标注地雷而非逐步照本宣科、以真实通过率度量而非相信声称。 精讲三:构建智能体,而非管道来自 Sean Goedecke Sean Goedecke 厘清了 LLM 程序的两条根本路线:管道(代码定义控制流)与智能体(LLM 自主控制流)。核心结论:凡任务复杂到需要推理模型,就应该选 Agent——它能动态获取所需上下文,彻底绕开「RAG 检索」这个至今未解的技术难题。管道胜在可预测和成本可控,但智能体在上下文采集阶段天然占优,这也解释了为何 Claude Code、Codex 等所有顶级 AI 编码产品全部选择 Agent 架构。 速览更多值得关注的内容 · 一周 3.3k star,微软开启 Skills 自我进化!像训练神经网络一样训练技能 — 机器之心 · AI 原生时代下,让世界适应 Agent,而非教 AI 做人 | 港大黄超@AIGC2026 — 量子位 · 进展如何?语言模型中的强化学习招募了一条功能性福利轴 — LessWrong — LessWrong · 「Token」必须死? — 36 氪 · 蚂蚁三代 CTO 闭门对话:周期穿越、技术决策与 AI-Native 组织 — InfoQ 中文 · Chatbase 如何在 AI 时代不融资做到 1000 万美元 ARR:Yasser Elsaid 的增长实战 [视频] — EO · 解决方案或许是取消我的 AI 订阅 — Simon Willison's Weblog 补充阅读今天额外值得一读的几条 · 七年时间窗口的护城河:为什么耐心是你的竞争优势 — Garry Tan(@garrytan) · 比 YOLO 更安全:主机执行审批的自动模式 — OpenClaw Blog · τ0-WM:最大规模预训练的开源具身世界模型来了 — 量子位 · MiMo-V2.5 系列推理全链路优化:将 Hybrid SWA 效率推向极致 — Xiaomi MiMo · 别光给 Agent 加 Tool 了,它根本选不明白!复旦×通义提出全新 CUA 训练范式 — 量子位 · Rubrics 综述:Agent 时代,如何定义一个「好答案」? — 机器之心 · OpenAI 的“护栏”系统:产品经理无需工程师写代码,即可交付超过 10 万行代码 — Aakash Gupta(@aakashg0) · DuckDB Quack:基于 HTTP 的客户端/服务器协议,实现多用户分析 — InfoQ · #563. “什么事都不会发生”结束了:纳瓦尔谈 AI、组织、硬件与不理性的乐观 [播客] — 跨国串门儿计划 相关链接· Benedict Evans 谈 AI 的真实走向:平台迁移、劳动变化与价值归属 [视频]:https://www.bestblogs.dev/video/ed8426c · 删除 95% 的 Agent Skills 后,WorkOS 如何让智能体结果变好 [视频]:https://www.bestblogs.dev/video/f95e394 · 构建智能体,而非管道:https://www.bestblogs.dev/article/572b4e71 · 一周 3.3k star,微软开启 Skills 自我进化!像训练神经网络一样训练技能:https://www.bestblogs.dev/article/7b8c6b8d · AI 原生时代下,让世界适应 Agent,而非教 AI 做人 | 港大黄超@AIGC2026:https://www.bestblogs.dev/article/5086df1c · 进展如何?语言模型中的强化学习招募了一条功能性福利轴 — LessWrong:https://www.bestblogs.dev/article/cc07b331 · 「Token」必须死?:https://www.bestblogs.dev/article/474eb3e0 · 蚂蚁三代 CTO 闭门对话:周期穿越、技术决策与 AI-Native 组织:https://www.bestblogs.dev/article/d14d6e24 · Chatbase 如何在 AI 时代不融资做到 1000 万美元 ARR:Yasser Elsaid 的增长实战 [视频]:https://www.bestblogs.dev/video/e8221bf · 解决方案或许是取消我的 AI 订阅:https://www.bestblogs.dev/article/9d6b3025 · 七年时间窗口的护城河:为什么耐心是你的竞争优势:https://www.bestblogs.dev/status/2061080196229525808 · 比 YOLO 更安全:主机执行审批的自动模式:https://www.bestblogs.dev/article/98816042 · τ0-WM:最大规模预训练的开源具身世界模型来了:https://www.bestblogs.dev/article/22e0cf5c · MiMo-V2.5 系列推理全链路优化:将 Hybrid SWA 效率推向极致:https://www.bestblogs.dev/article/616933e5 · 别光给 Agent 加 Tool 了,它根本选不明白!复旦×通义提出全新 CUA 训练范式:https://www.bestblogs.dev/article/da456913 · Rubrics 综述:Agent 时代,如何定义一个「好答案」?:https://www.bestblogs.dev/article/d170c0c0 · OpenAI 的“护栏”系统:产品经理无需工程师写代码,即可交付超过 10 万行代码:https://www.bestblogs.dev/status/2061176400611320290 · DuckDB Quack:基于 HTTP 的客户端/服务器协议,实现多用户分析:https://www.bestblogs.dev/article/66368033 · #563. “什么事都不会发生”结束了:纳瓦尔谈 AI、组织、硬件与不理性的乐观 [播客]:https://www.bestblogs.dev/podcast/ac6e43b 关于 BestBlogs BestBlogs.dev 是 AI 驱动的私人阅读助手。它从 RSS、Newsletter、Twitter、YouTube、Podcast 等来源中筛选高质量内容,为关注技术、AI、产品、商业、研究、设计、投资、文化、个人成长等多元方向的读者整理每天真正适合自己的阅读流。 BestBlogs Pro 早鸟内测开放:关注你感兴趣的来源、配置兴趣标签,每天收到一份属于自己的「我的早报」。欢迎体验:https://bestblogs.dev 前往小宇宙评论区与主播互动

    13 min

About

BestBlogs 早报音频版,精选 AI、技术、产品、设计与商业科技领域值得关注的高质量内容,陪你每天从真正重要的信息开始。