1 小时 1 分钟

大模型只是起点：朝向多智能体和人类紧密协作的未来｜对话清华叉院吴‪翼‬ 科技沉思录

- 科技

在OpenAI的YouTube官方账号里，一个小红人追着小蓝人玩捉迷藏游戏的视频有最高的点击率。

在强化学习算法下，小红和小蓝这些AI小人在虚拟世界里面不停玩游戏，一开始的小蓝只会躲，在日夜重复玩了上万轮之后，它们开始发现策略、学会协作、甚至反制。
第一期节目，我们邀请到了清华大学交叉信息研究院助理教授吴翼，他也是捉迷藏游戏的团队成员之一。在2022年回国任教前，他曾在OpenAI工作了一年半的时间。在他现在的办公室里，有意思的AI实验还在发生，有的训练AI玩游戏，有的指挥机器狗追小球，而这些共同的目的是想做一个能与人交互的通用AI。
在本期播客，你将听到：学术界与工业界之间、中美公司之间研究AI的区别在哪里？为什么将游戏作为AI的研究对象？机器人的GPT-3时刻是什么？ChatGPT对机器人有什么帮助？如何考虑AI的安全与对齐？
【主持人】戴雨森真格基金管理合伙人
【嘉宾】吴翼清华大学交叉信息研究院助理教授
【时间轴】
01:56 打游戏，指挥机器狗追小球，吴翼的团队正在做什么
03:39 ChatGPT不能把事情全做完，它只是起点
10:44 OpenAI的研究方式不同于传统的学术界和工业界
11:50 如何看待OpenAI从非盈利组织转为盈利性公司？
14:42 字节会做出中国领先的大模型吗？
17:36 AI喜欢研究游戏，因为游戏是足够复杂的模拟世界
30:28 机器人的GPT-3时刻：机械手拧魔方
38:25 AI可以写小说、玩游戏，但做不到给你递一杯咖啡
50:24 给大模型加一些不确定性，防止它自信地胡说八道
55:08 未来人们的工作可能都在为AI创造数据
58:37 吴翼最近在筹备的创业团队
【相关资料】
吴翼清华主页
Multi-Agent Hide and Seek
这个小AI后来学会了一些奇技淫巧，我们看到以后就第二次地崩溃了 | 吴翼一席第811位讲者
【联系我们】
公众号：真格基金（ID: zhenfund）
收听渠道：小宇宙｜Apple Podcast｜喜马拉雅
邮箱：yusen_dai@zhenfund.com
如对节目有任何的建议与期待，也欢迎大家在留言中互动～

1 小时 1 分钟