晚点聊 LateTalk

晚点 LatePost

《晚点聊 LateTalk》由《晚点 LatePost》出品。 最一手的科技访谈,最真实的从业者思考。

  1. 1D AGO

    OpenClaw、OpenAI vs Anthropic的三重对阵、自进化丨AI季报26Q1

    「Coding→Agent 大主线明细,从模型的竞争到系统的竞争。」 本期播客本周内也会在《晚点 AI》公众号发布「图文版」,发布后会更新到 Shownotes 和评论区。 从 26 年 Q1 开始,《晚点聊》推出季度总结系列,会分为 AI 季报和具身季报。 其中,AI 季报的嘉宾是身在硅谷的 MoE capital 创始合伙人 Henry Yin。他此前已经两次做客晚点聊,分享过 Agentic 工具链的创新机会,和 Gemini 3 后的新进展,分别是 137 期和 146 期。 本期节目我们从 OpenClaw 开始聊 Q1 的进展,进而延展到 Anthropic 的 Claude Code 和 Cowork 产品的强劲增长,Anthropic 应用形态与 OpenClaw 的相向而行,以及 OpenAI vs Anthropic,两家公司的 coding 产品 Codex vs ClaudeCode 和这背后的最新模型 Opus 4.6 vs ChatGPT-5.4 的三重对阵。所有这一切的快速进展,居然都发生在过去 3 个月。 在 Coding 到通用 Agent 和个人 Agent 这条主线之外,我们也讨论了 AutoResearch 等项目的 AI 自进化能力,和仍处于探索中的其它方向,如持续学习和世界模型。 Henry 也分享了,他在硅谷这个 AI 密度最高的地方,感受到的社会情绪变化:科技大裁员。而我则补充了我了解的中国公司的情况。 不管是 Agent 主战场的快速发展,还是自进化开发方式端倪初现,26 年前 3 个月的变化显示,AI 越来越不只和科技圈相关。 本期嘉宾 Henry Yin,MoE Capital 创始合伙人 本期主播 程曼祺,晚点科技报道负责人 时间线: Openclaw:AI Agent 的 iPhone 时刻 04:30 Q1三件大事:Openclaw异常火爆、头部模型厂商竞争焦点转移、AI自我进化贴近现实 07:35 Openclaw 做对的三件事:本地运行、接入聊天APP、定时任务和长期记忆 10:42 两个使用案例:一周卸载 vs 深度试用 14:03 热度差异:中国国民级、美国不出圈,Why? 17:02 中国开源模型乘势增长:OpenClaw 之父 Peter 安利 MiniMax 22:41 三个不足:贵、不稳定、安全隐患:Meta 对齐负责人的龙虾“生死时速” OpenAI vs Anthropic 的三重竞争 30:10 大公司竞 “吃龙虾”:英伟达、Anthropic、OpenAI 各自动作 37:14 190 亿 vs 250 亿:Anthropic 收入猛追 OpenAI,Claude Code 也超过了 Cursor 43:53 CodeX 是会编程的 “弱智”,Claude Code 是驱策编程奴隶的主人 48:30 OpenAI 的反思:“我们分心了” 49:57 xAI 的人员动荡,Google 的产品发力 53:04 竞争焦点从模型转向平台:开发者生态、企业信任、成本 AutoResearch 自进化出现端倪 01:07:09 AutoResearch,明确目标的有限搜索空间里,AI 已展现 “自进化” 01:17:00 持续学习的两种方法:贫穷版外挂 & 更新权重的新探索 01:22:48 新方向上的创业机会:几个水下 (Stealth Mode) 公司案例 算力变化:推理↑ CPU↑ 01:27:00 GTC 要点回顾:推理重要性提升 01:29:05 Agent 应用带来 CPU 需求提升 科技大裁员 01:31:27 Meta 停工学 AI 一周,Token 消耗量成关键指标 01:35:20 从 “一流人才 + 二流人才” 到 “超一流人才 +AI” 01:42:39 给 Token 收税 ? 下季度展望 01:44:07 DeepSeek-V4、更新权重的持续学习从复杂到简单 01:49:21 连点成线:从 Devin 到龙虾的 1 年半,Agent 即将带来更多变化 剪辑:甜食 相关链接: 150 期:年末 AI 回顾:从模型到应用、从技术到商战,拽住洪流中的意义之线 150 期图文版:《年末 AI 回顾:从模型到应用,从技术到商战,拽住洪流中的意义之线》 146 期:Gemini 3 翻盘背后、Agent 需要什么大模型、RL 创业机会,与前 Google 创业者、硅谷投资人聊湾区动向 137 期:Agent 是机会,造 Agent 的工具也是|从 OpenAI 开发者日聊起|Agent#6 137 期图文版:OpenAI、Google、Anthropic 都在做的 “Agent 工具箱” 是什么 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:

    1h 52m
  2. 贾鹏创立至简后的首次访谈:从英伟达到理想,具身智能的六边形战士

    MAR 22

    贾鹏创立至简后的首次访谈:从英伟达到理想,具身智能的六边形战士

    「具身智能的竞争,本质是体系的竞争。」 今天的嘉宾是一位没有亮相过的具身智能创业者,理想前自动驾驶技术研发负责人贾鹏。 2016 年,他成为英伟达中国智驾团队的第一个员工。五年后的 2020 年,他加入刚开始自研智驾系统的理想,和团队一起实现了逆袭。 去年夏天,贾鹏创立具身智能公司至简动力,他拉来了之前的上司,理想前 CTO 王凯,以及和他并肩战斗过五年的理想智驾前量产负责人王佳佳一起创业。 它符合中国投资具身智能的一种典型审美——创始团队有丰富的研发和量产经验。在被认为与具身关系密切的自动驾驶战场,打过硬仗、打过胜仗。而且核心团队之间磨合已久,分工默契。 成立的最初半年里,至简就融资 20 亿元人民币,是现在最年轻的具身智能独角兽。 作为创业后的首次访谈,贾鹏在这期节目中完整回顾了从英伟达到理想的智驾探索,再到具身智能的创业思考。 他给公司取名至简,因为他相信,大道至简,越简单的东西,越容易规模化。 本期访谈的视频版已经发布,可在抖音、微信视频号和 B 站,搜索《晚点聊》收看。 本期节目的图文版也已经发布:至简贾鹏:最快具身独角兽半年融资 20 亿,做 “六边形战士” 才能活 本期嘉宾 贾鹏,至简动力创始人 & CEO 本期主播: 程曼祺,晚点科技报道负责人 时间线: 2016~2020 英伟达:“老黄脑门的温度比别人高一度” 00:01 英伟达智驾中国团队第一个员工 09:10 从服务 L4 自动驾驶到转向量产 13:57 从工程师到架构师、多面手 15:13 老黄凌晨 5 点起床看邮件、论文,脑门温度比太太高一度 18:07 英伟达的前瞻投入心法:能抗外压、愿景共享、主业强劲 2020~2025 理想智驾:后来者怎么先交卷 22:30 李想当时怎么想智驾:数据重要性,下半场看智能化,“车和家” 29:25 一起看《全营一杆枪》的日子 34:44 自研第一仗:双 J3 交付高速 NOA,一群 “新手” 的生死战 40:06 抗住压力的转身:有图切无图 48:03 智驾 “做成” 的 3 重指标 2025 的具身创业新起点:“挑战自我成长极限” 51:16 FSD v14 “让人又惊喜、又失望”,该做新的事了 59:41 “第一个大概率会死,但做成的会上第一批”,具身创业现在仍是第一批 01:07:51 模型、产品、组织都要简单;同时得是 “六边形” 战士 01:14:01 具身的终局是 “分散” 的垄断 01:19:46 具身研发分 3 层,“合成数据有用,但绝不是主力” 01:34:30 To A(研究)到 To B 阶段的转换会如何发生? 01:42:01 具身的本质是 Physical Agent:大公司做底座,创业公司做 Agent 01:48:13 不做流水线替代,寻找 “端到端” 任务 具身公司该如何组织 & 行业观察 01:57:23 智驾与具身:相似的、不同的 02:01:34 不设组织架构,以项目驱动团队 02:18:05 少被讨论的现象:硬件还远未成熟 02:19:29 更强具身智能到来时间仍有分歧 02:25:03 具身上市潮之后,会如何? 02:37:28 擅长从 0 到 1 逆风局,创业这半年 “挺爽的” 本期剪辑:宇亮、Nick 相关链接: 152 期:访谈千寻创始人韩峰涛:20 亿新融资、具身模型淘汰赛、落地非共识 149 期:具身模型哪家强?与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望 148 期:访谈它石创始人陈亦伦:具身的三道曙光和第一道关卡 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:

    2h 48m
  3. MAR 11

    从千问变动到「AI 英雄传」,与 DINQ 高岱恒聊传奇 AI 研究员们

    「美第奇和达芬奇,大公司和 AI 研究员。」 今天的节目分两次录制。嘉宾是高岱恒,Sam,他在 AI 技术圈和开源社区非常活跃,曾是双非土木老哥,后来以因为对 AI 开源项目的贡献进入阿里达摩院,现在自己创业,做了一个找到 AI 人才的 Agent 产品 DINQ。 而本期我们聊的主要话题,却是他的副业和 “消遣”:挖掘 AI 人物故事。Sam 对此非常着迷,在达摩院时,他就很喜欢搜集 AI 大牛的人生故事,那些非典型的、充满反差的经历尤其吸引他。 本期的第一部分,我们聊了上周刚发生的阿里千问的人事变化。Sam 分享了他作为开源模型受益者和前达摩院成员的观察。这整个过程的更具体情况,大家也可以看《晚点 LatePost》从上周到本周发布的 3 篇报道,以及我们的上一期播客。 本期第二部分,我们聊了 Sam 津津乐道的 AI 人物英雄传,在 Sam 眼里,这些不问出处、不拘一格的研究者就像文艺复兴时期的大师。他们有各自的性格、癖好、执念和技术浪漫,这对大型商业组织来说是陌生的、需要适应和理解的,我们也由此聊到了未来的研发型人才市场会如何变化。 本期嘉宾: 高岱恒 Sam DINQ 创始人 本期主播: 程曼祺 晚点 LatePost 科技报道负责人 时间线: 千问变动后续 02:42 千问候选人被搜索量翻了 3 倍 09:34 Model Scope 魔搭社区价值几何? 14:30 美第奇和达芬奇,大公司和 AI 研究员 AI 英雄传(第一次聊,春节前) 22:38 DINQ 的诞生,AI 研究员需要更好地展示、更好地匹配 28:30 他们就像文艺复兴时期的大师 42:26 从土木老哥到达摩院,“当你有了作品,没人在问你学校” 49:52 Adam 发明者、被拒的 GPT-1 一作、旅居越南的 RAG 发明者………创新来自边缘地带 01:10:23 他们的追求、畏惧、不屑和弱点 01:19:38 AI 下的人才市场:从人和公司的匹配,到人和具体任务的匹配 01:43:48 连点成线 相关链接: 134 期:Meta AI 人才动荡,上亿美元为何留不住人?| 与 Pokee AI 朱哲清盘点 AI 组织 本期剪辑:Nick 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:

    1h 47m
  4. FEB 26

    访谈千寻创始人韩峰涛:20 亿新融资、具身模型淘汰赛、落地非共识

    「26 年不是落地生死之年。」 本期嘉宾,是新近完成近 20 亿元融资,估值突破 100 亿元的具身智能公司 千寻智能的创始人和 CEO 韩峰涛。此前,千寻的联创 高阳也两次做客《晚点聊》,分别是 112 期和 149 期。 90 后的高阳,从伯克利回国加入清华叉院, 是典型的新锐 AI 技术力量,和他搭档的 80 后韩峰涛,则代表中国具身领域的另一条路:他是一位在 2016 年第一轮 AI 热潮时开始做智能机器人的创业老兵。他见证过被抢着要份额的热潮,正如现在的具身赛道;也一度背负个人连带债务,度过行业的冬天。 这期节目,我们回顾了过去 15 年,韩峰涛亲历的中国工业机器人、智能机器人再到具身智能的变化。也聊了近期具身领域,数笔大额融资背后的行业转折和 26 年的竞争主题。 我们提到了 1 次 VLA,0 次世界模型,但提到了好多次客户,这是韩峰涛的肌肉记忆。 但他也反复说:26 年不会是具身行业的落地生死之年,而是具身模型性能快速爆发的一年,这是一个经历过上一轮起伏的创业者,转变的决心。 本期嘉宾:韩峰涛 千寻智能创始人&CEO 本期主播:程曼祺 晚点 LatePost 科技报道负责人 时间线跳转: -2015-2024:工业协作机器人的 10 年创业: 02:03 浙大、中国核电、国机:找不到工作的模式识别研究生 09:10 国产替代 → 2016 年 AI 热潮 → 大模型:技术变革终于来了 14:37 在大厂下场前成为“中厂” -2024 第二次创业:千寻智能的成立 22:40 密集见了 100 多人,找到合伙人高阳,“靠谱的太少,骗子太多” 33:02 26 年的具身领域会像 23 年的大模型:模型性能淘汰赛 -解决数据瓶颈 35:55 主要靠真实数据,24 年 5 月开始开发 UMI、外骨骼等穿戴式数采设备 -落地应用探索 46:59 宁德时代在具身行业里广发需求 53:33 场景选择门道:当前智能能力、节拍、精度、负载、价值(用量)和容错率的综合考量 59:01 未来场景拓展:先工业、商业,再家庭;先 to B 再 to C 01:04:37 26 年不是具身落地生死之年,而是模型性能爆发的一年 -从 Robotics 到具身智能 01:15:57 第一次创业起伏:资金链 3 次紧张,背负个人连带债务 01:25:24 新一批年轻创业者有相似的“天真”,“真的见过客户”后会改变 01:28:12 从 Robotics 到 AI 思维的转变:数据,数据 01:33:57 建立一个信任、追求卓越的组织 连点成线 相关链接: 独家专访千寻创始人:20 亿新融资、具身模型淘汰赛、落地非共识 晚点聊 112 期:与千寻高阳聊具身:一个像机器人的人,怎么做像人的机器人 晚点聊 149 期:具身模型哪家强?与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望 本期剪辑:甜食 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:

    1h 42m
  5. FEB 12

    访谈 MuleRun 陈宇森:Claude Code 带来 Agent 创作新范式、未来的软件是日抛式的

    「软件应用也可以 “3D 打印” 了。」 当 Agent 构造变得越来越简单,会发生什么?Agent 交易平台 MuleRun 创始人陈宇森分享了他的观察和创业实践。 陈宇森是一名少年成名的连续创业者,22 岁从浙大毕业后创办网络安全公司长亭科技,5 年后卖给阿里云,现在他带着对 AI Agent 的理解重新出发。 MuleRun 基于这样一个核心假设,当 Vibe Coding 大幅降低了应用开发门槛,Claude Code 带来 Agent 创作新方法,大量非技术背景的人也能把自己的工作知识和流程封装成一个个勤恳的 AI 骡子,实现个人工作的自动化。 这期内容包含两次聊天,分别发生在 25 年 12 月和 26 年 1 月上旬,不到 1 个月里,随着 MuleRun AgentBuilder 开始内测,陈宇森和 MuleRun 的思路已发生了一些变化。 他认为,未来的 market place 不再会是过去我们熟悉的货架形态,而是在对话中触发交易。MuleRun 的调整本身,也是当前 AI 应用瞬息万变的一个缩影。 这期节目的后半段我们也聊了一个创业 10 年,成立过 4 家公司,经历过成败起伏的创业者,如何以「用心」避免陷入平庸和对抗自我怀疑。 本期节目的图文版也已经发布:访谈 MuleRun 陈宇森:Claude Code 带来 Agent 创作新范式、未来的软件是日抛式的 本期嘉宾: 陈宇森,MuleRun 创始人 & CEO 本期主播: 程曼祺,晚点 LatePost 科技报道负责人 时间线跳转: -12 月底的访谈:寻找方向、Agent 交易平台的机会与难点 02:20 从 Vibe Coding 到 Agent 交易平台 09:20 Agent 的供给还不够丰富,但 Claude Code 带来拐点 16:41 MuleRun 做的两件事:好的 Runtime、清晰的 Skills、Prompt 的商业化 23:08 同样的技术变化,不同的做法:N8N、Dify、Coze、蚂蚁灵光、马卡龙、Youware 28:54 上线 3 个月:用户反馈、Agent 审核与上架、大量 SOP+少量大模型的开发方式 36:50 做好 Agent 的开发工具和交易平台的难点 40:29 如果 Agent 建造门槛大幅降低,通用 Agent 还存在吗? -1月中旬的访谈:Agent Builder 内测开启、交易平台不会再是货架式 42:21 再聊 Claude Code:Skills 详解,MuleRun 的 Skill 评价体系(Eval)和安全工作 47:32 “应用的 3D 打印机”,未来的软件是日抛式的,AI 是制造业 52:12 Agent Builder:从套壳模型→套壳“Claude Code” 01:01:22 Agent 构造变简单、数量变多:未来的 Market Place 不应该是货架式的 01:08:32 Agent Builder 的内测效果,Agent 开发工具和交易的界限? -12 月底的访谈:创立 4 家公司,成功退出过也低谷过,以「用心」对抗平庸 01:15:40 从长亭到同时创业做两家公司,一度觉得自己无所不能 01:25:24 走过下坡路,关过公司,痛苦带来的韧性 01:32:13 一定不要在选择题上出错,「用心」对抗平庸 01:40:16 26 AI 应用市场年会发生什么?跳出 Chatbot、跳过 1 亿甚至 10 亿美元 ARR 01:44:02 连点成线 往期相关节目: 106 期:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need|Agent#1 137 期:Agent 是机会,造 Agent 的工具也是|从OpenAI开发者日聊起|Agent#6 150 期:年末AI回顾:从模型到应用、从技术到商战,拽住洪流中的意义之线 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:

    1h 47m
  6. FEB 9

    年末AI回顾:从模型到应用、从技术到商战,拽住洪流中的意义之线

    这期是「晚点聊」的年终特别节目,在 AI 大事必定发生的春节之前,总结 2025 年和即将过去的蛇年,我们在 AI 领域的观察和见闻。 本期节目,我会以单口的形式来讲述,我将按几个大的主题来串起这一年在 AI 领域的观察,行业的一些大事件,以及「晚点聊」的相关节目,和整个《晚点 LatePost》对 AI 的更多报道。 你将你听到以下 7 个章节的内容:1.模型;2.应用;3.巨头的 AI 之战:字节、阿里、腾讯;4.创业公司们;5.具身智能;6.AI 硬件;7.AI 中的人。 在每个章节中,我会按照若干关键词来展开要点,并穿插指路《晚点聊》的相关往期节目或《晚点》的相关文章。我会把提到的文章,列在 shownotes 里。 历史正在加速发生,AI 洪流中,五色使人迷目。但人是意义的动物,我们总试图理解和抓住什么。 希望这期年底的大型“连点成线”,可以帮听友得到一份正在拓展中的 AI 地图。 时间线跳转: 1.模型 01:10 Agentic Model:R1 | Coding | 多模态 08:58 协同优化:Google | DeepSeek 开源周 | 注意力机制改进、芯片互联 15:22 下一个学习范式:从大脑获得灵感 2.应用 19:49 Agent:Coding 就是 General Agent | 垂类 Agent | Agent 工具链 32:02 Sora App:to C 的想象力 37:19 AI for Science:AI 科学家 3.巨头的 AI 之战 40:23 人才和组织之战 49:51 To C 应用大战 4.AI 创业公司们 01:01:28 大模型第一股 01:07:13 5000 万美元 ARR 01:11:36 全球化与中美之间 5.具身智能 01:14:29 投资和上市潮 01:22:09 数据、模型、本体的进展 01:28:05 5 个落地方向 6.AI 硬件 01:34:50 AI 眼镜能成为下一个入口吗? 01:44:30 深圳的公司们 7.AI 中的人 01:49:48 天价薪酬与失业 01:52:39 使用用 AI 的人 01:54:25 意义感:大模型无法替你活过 相关联链接: 《DeepSeek-V3/R1推理系统概览》 Top Lean AI-native Companies Leadboard:https://leanaileaderboard.com/ 本期中提及的《晚点聊》往期节目,可根据期数搜索;本期中提及的《晚点 LatePost》相关报道: 「应用」 《实测豆包手机助手:比价点外卖、自动回微信,AI 操作手机的时代来了?》 《“先抖音后剪映” 不再成立,OiiOii 闹闹聊 AI 时代的创作工具和内容社区丨100 个 AI 创业者》 《他给普通人配了个 “AI 剧组”丨100 个 AI 创业者》 《晚点对话明超平:他们不信 AI coding 会是新的创作方式,我很开心》 《25 岁,他想做 AI 时代的微信丨100 个 AI 创业者》(Intent) 《对话与爱为舞张怀亭:大哥创业不走弯路》 「巨头 AI 之战」 《腾讯在 AI 拐点到来前的 700 天》 《字节 AI 再创业:独立组织、全链条的饱和出击》 《重新认识阿里:大踏步迈向 AI》 《字节、阿里、腾讯的 AI 人才竞赛:2330 个研究者背后的共识与分歧》 《字节、阿里、腾讯 AI 大战全记录:一场影响命运的战争》 「具身智能」 《特斯拉人形机器人再延期,因为双手只能用六星期》 视频:《具身智能的幻想与现实》 「AI 硬件」 《这个 30 克的挂件,是 AI 的眼睛丨100 个 AI 创业者》(Looki) 《“通用产品是空中楼阁”,潘宇扬聊 AI 硬件丨100 个 AI 创业者》(Odyss AI 项链) 《对话 VITURE 姜公略:把 AR 眼镜卖到美国第一 ,从负需求到离不开》 《对话拓竹陶冶:我们一群工程师,一起造一个朴素的硬核公司》 《影石 Insta360 刘靖康:当机会稀缺,年轻的后来者如何做到第一?丨新新访谈》 《我们要培养什么样的工程师?李泽湘教授对三十年工科教育改革的回顾》 本期剪辑:甜食、Nick 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:

    1h 58m
  7. JAN 25

    具身模型哪家强?与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望

    「用大规模测评驱散 PR 式 demo 的迷雾。」 虚拟空间的大模型有大量 benchmark,测试非常直观;而在如火如荼的具身领域,怎么衡量模型能力,本身还是需要探索的课题。 这期,我们邀请了两位具身智能从业者,原力灵机联创范浩强和千寻智能联创与首席科学家高阳,一起聊具身模型的测评。 范浩强从高三就开始在旷视工作,有丰富的计算机视觉开发和落地经验;高阳回国前在伯克利 BAIR 攻读博士,和 PI 的联创 Sergey Levine 有诸多学术合作。 去年 10 月,原力灵机和 Hugging Face 联合发起了全球首个具身智能的大规模真机评测平台 RoboChallenge。在前不久释放的最新测评结果中,千寻的 Spirit v1.5 模型登顶榜单,表现超过 π*0.5。 RoboChallenge 测评平台网站:https://robochallenge.ai/home 图注:RoboChallenge 测评现场 在 RoboChallenge 的测评中,机器人不再只活在精挑细选的 Demo 视频里,而是要在多样化的“Table 30”任务中接受真实世界的“毒打”——任务包括碎纸、插花,扫二维码。 这期我们聊了具身模型测评的难点,RoboChallenge、RoboArena 等目前的大规模测评尝试是怎样的思路?行业里心照不宣的 demo 工程,以及 2026 年,我们可能从哪些路径逼近具身智能的 GPT-3 时刻。 范浩强和高阳说,组织和参与测评的过程,组织和参与测评的过程,本身增强了他们对具身的信心,,从 π*0 在 Table 30 任务上只有 20% 的成功率到 π*0.5 的翻倍和一些国产模型的超越,具身仍很早期,但进步速度也很惊人。 本期嘉宾: 范浩强 原力灵机联合创始人 高阳 千寻智能联合创始人、清华大学叉院助理教授 本期主播: 程曼祺 晚点 LatePost 科技报道负责人 时间线跳转: -发起 RoboChallenge,行业呼唤大规模测评 03:24 范浩强和高阳的从业经验 06:53 RoboChallenge 的发起,见证成功率从 π0 的 20% 到 π0.5 的超 40% 12:40 以往方法的问题:环境不一致、测评不持续、仿真有局限 21:47 对比 RoboArena 和 RoboChallenge:前者是分布式 Zero-shot 测评;后者是集中 few-shot 测评 28:33 上线 2 个多月的观察:超预期的 1 万条测试提交,国产模型超越 33:04 Table 30 任务集的设计,插花、扫二维码等任务的“刁钻”考点 40:24 提交者自己做 fine-tune(微调),开源权重证明诚信;接下来会更新灵巧手的测评 -2026 年具身展望 45:07 学习原理已经收敛,Scaling Data 是 2026 年的行业主题 48:53 4 种数据类型,各团队的不同数据 bet 57:20 落地应用,具身的“Coding”任务是什么?“破圈”时刻何时出现? 01:07:00 大众与从业者之间的认知落差,行业心照不宣的“demo”工程 01:12:50 具身测评可以被 Hack 吗?如何反制 hack? 01:14:52 26 年想验证的问题:具身中国追平美国的 DeepSeek 时刻是否到?基模能否上一个台阶? 01:17:47 连点成线:总结观察具身进展的 3 个维度 & 具身创业团队的不同来源 附录:本期中出现的一些人物、技术名词、项目、公司 -Sergey Levine:Sergey Levine,加州大学伯克利分校教授,机器人强化学习与通用学习系统的重要推动者。曾参与 Google / Google Brain 的机器人与强化学习研究,并共同创立具身智能公司 Physical Intelligence(PI)。 -π 系列模型:PI 提出的通用机器人模型系列,最新版本 π*0.6。 -CIFAR:一个经典计算机视觉数据集,相比之后出现的 ImageNet,它规模更小、分辨率更低,常用于快速实验和教学。 -Sunday Robotics:由 Tony Zhao 与 Cheng Chi 在 2024 年联合创立的家庭场景通用机器人公司。 -Generalist AI:2024 年成立的美国通用机器人 / 具身智能的创业公司。 本期剪辑:Nick 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:

    1h 22m

Ratings & Reviews

4.2
out of 5
31 Ratings

About

《晚点聊 LateTalk》由《晚点 LatePost》出品。 最一手的科技访谈,最真实的从业者思考。

You Might Also Like