牛油果烤面包

#134. 大模型

本期节目我们请到了大语言模型的专家Mengdi来给我们介绍一些大语言模型是怎么回事,DeepSeek有什么特别之处,以及大语言模型的推理能力等话题。

嘉宾:Mengdi
主播:斯图亚特、Vindy、Cat
策划:斯图亚特
剪辑&时间线:季雨清

  • 00:00:59 从支持向量机到强化学习
  • 00:04:45 All in大模型
  • 00:06:17 什么是大语言模型
  • 00:09:43 ChatGPT时刻
  • 00:10:20 为什么被称为语言模型
  • 00:14:16 ChatGPT如何大力出奇迹
  • 00:20:51 ChatGPT时刻后的创新
  • 00:23:19 DeepSeek
  • 00:26:19 业内怎么看DeepSeek的出圈点
  • 00:28:20 为什么是OpenAI
  • 00:29:20 为什么推理依靠强化学习
  • 00:30:35 推理是否可以泛化
  • 00:39:07 推理泛化的局限
  • 00:43:34 推理的未来
  • 00:45:30 什么是蒸馏
  • 00:52:37 DeepSeek对当前研究的影响
  • 00:56:00 大模型领域的发展方向
  • 00:58:49 AI Agent
  • 00:59:21 通用人工智能
  • 01:01:54 未来科研怎么走
  • 01:05:00 AI应用
  • 01:06:40 进入AI核心圈需要做什么准备

关于「牛油果烤面包」
「牛油果烤面包」播客入选2020苹果最佳播客,获得年度编辑推荐,聊科技发展趋势,聊各行业来龙去脉。我们坐标硅谷,邀请第一线的资深专家分享给大家听!

欢迎您在每期节目下方给我们留言,和我们的主播互动交流,或是添加微信小助手nygkmb2022,加入微信听友群。如果您对我们的志愿者工作有兴趣,请点击 这个链接 看我们的招募帖;你有什么有趣的话题,想来作牛油果烤面包的嘉宾,或是对节目有任何的意见或建议,欢迎发邮件和我们联系。我们的邮件地址是:host@avocadotoast.live

图片: Generated by Dall-E

片头片尾音乐:
Courante 1st Cello Suite
Exzel Music Publishing (freemusicpublicdomain.com)
Licensed under Creative Commons: By Attribution 3.0
http://creativecommons.org/licenses/by/3.0/