قبل ٨ ساعات
١٣ من الدقائق

EP45 抛弃LLM?！从“知”到“行”，如何让机器人学会“做梦”与“直觉”？

🔥 【核心突破】
⚡️ 学习革命：四足机器人1小时学会站立行走，跌倒后10分钟掌握翻身
🚀 效率跃升：生成式模拟器减少90%真实世界试错成本
💸 技术拐点：Google Veo 3实现零样本物理推理与工具使用
🌐 新定律："世界经验Scaling Law"开启交互学习智能体万亿赛道

🔍 章节索引

一、LLM困局：为什么语言模型永远教不会机器人？
→ 根本缺陷：
- LLM仅模仿表面，缺乏目标驱动与经验学习能力
- 语言与动作天然脱节，"轻轻放置"无法指导具体力学参数
→ 延迟致命：
- 大模型推理延迟数百毫秒，无法满足动态环境实时需求
- 导致规划层与控制层严重割裂，机器人行动笨拙迟缓
→ 人类对比：
- 人类靠"做"与"直觉"学习（如开车/打球），非依赖推理手册
- 通过心理模拟预判结果，形成内部预测模型

二、视觉直觉：视频模型如何重构AI认知？
→ 学习机制革命：
- 通过预测像素序列直接学习物理规律与因果关系
- 如同LLM预测文本，但维度从语言升级到物理世界
→ 能力实证：
- Google Veo 3零样本完成分割/物理推理/工具使用
- 展现类似人类的"视觉直觉"，无需大量标注数据
→ 本质定位：
- 生成式模拟器能预测动作导致的画面变化
- 赋予机器预见能力，实现直觉决策

三、世界模拟：Scaling Law如何扩展到经验领域？
→ Daydreamer突破：
- Pieter Abbeel让机器人在潜在空间自主规划
- 通过"想象"生成经验，端侧强化学习持续优化
→ 效率跃迁：
- 传统方法需数月真实训练，现压缩至小时级
- 试错成本降90%+，安全性大幅提升
→ 新定律诞生：
- "世界经验Scaling Law"：数据量×交互复杂度=智能水平
- 机器人成为自身模拟器，开启自我进化通道

四、应用前景：万亿美元交互智能市场如何布局？
→ 工业机器人：
- 复杂装配任务学习时间从6个月→1周
- 适应非结构化环境，故障率降70%
→ 家庭服务：
- 看护机器人通过观察学习个性化照护
- 餐饮机器人掌握"手感"精准控制力度
→ 自动驾驶：
- 生成极端场景模拟，训练成本降80%
- 预见潜在事故，决策速度提升5倍

صفحة الويب الخاصة بالحلقة

البرنامج

FutureCast/未来播报
تاريخ النشر

٦ أكتوبر ٢٠٢٥ في ١:٣٩ ص UTC
مدة الحلقة

١٣ من الدقائق
التقييم

ملائم

EP45 抛弃LLM?！从“知”到“行”，如何让机器人学会“做梦”与“直觉”？

المعلومات