【本期课题】
DeepSeek对AI产业的影响。
【栏目介绍】
在《产业观察》这档专栏里,我们会为你厘清不同产业的历史沿革,希望能够从中找到一些底层的规律。虽然当下变化迭起,但是所有新风口都有迹可循,不同产业的发展其实也有很多相似之处。
【免责声明】
本节目的所有内容并非旨在提供任何形式的建议,包括但不限于投资、税收、会计或者法律上的建议。
【本期主持人】
李罡,峰瑞资本副总裁。
【本期嘉宾】
季宇,行云集成电路创始人。
【内容索引】
03:32 春节期间,国产 AI 模型 DeepSeek引起了全球关注。它不仅引发英伟达股价震荡,甚至多国政府相继提出限制或禁用它。DeepSeek为何能掀起如此大的波澜?
04:12 在AI编程这个对逻辑性有极高要求的应用场景下,DeepSeek展现出卓越的模型效果,私有化部署后,它的运行效率远超云端API。从消费者角度来看,本地部署解决了以往大模型难以输出长上下文的痛点。
11:46 与国内外其他模型相比,DeepSeek有哪些关键的区别?
15:05 DeepSeek采用参数规模较大的MoE(Mixture of Experts)架构,在保证模型质量的同时,实现了显著的成本下降。DeepSeek的技术路线是如何实现的?
19:46 自Transformer和Attention架构诞生以来,上一次引发全球性大规模影响的是GPT 3.5,它来自美国公司OpenAI。而这一次,凭借创新出圈的却是一家中国公司。这背后或许跟国内企业受芯片禁令影响有关。
22:52 在算力资源不受限的情况下,OpenAI的发展受阻了吗?
24:39 如果模型的规模、能力和计算速度的增长没有那么快,那么,增加上下文长度会是下一个突破口吗?
27:50 未来几年可能会出现更多新的范式,它们跟原有范式可能是承接关系。例如,DeepSeek的R1模型是在V3这个足够好的基座模型的基础上,通过后训练(包括强化学习等技术)迭代而来的。
28:31 现在容易获取的数据基本都被AI训练过了,未来是否会变成AI自己生成数据来训练自己?
33:42 过去,大模型的发展逻辑是“算力+数据=模型能力”。DeepSeek证明,在有限算力下依然可以取得显著的效果。从模型的发展来看,未来还会有哪些瓶颈?
36:07 在DeepSeek开源的生态下,个人用户和企业用户都能相对容易地以较低的成本自行部署或复制出模型,那么AI模型公司的护城河在哪里?
37:59 DeepSeek的出现,是偶然的破局,还是产业发展的必然方向?
40:08 DeepSeek能否真正绕开英伟达的CUDA生态?
41:42 当前,Scaling Law推动千卡、万卡集群的形成,本质上是在构建一个大型规模的计算体系。如果未来围绕DeepSeek、国产芯片以及AI普惠目标,我们能够打造出类似过去的x86集群和个人电脑的生态系统,或许可以逐渐让这个“大型计算体系”失去其核心价值。
43:52 过去,一些国产芯片企业难以找到很好的下游商业场景。DeepSeek的开源模型相对标准化,不同芯片只要能够高效运行它,都可以通过API接入服务。这为国产芯片企业提供了新的可能。
46:22 作为创业者,如何看待梁文峰所说的“技术优势是短暂的,真正的护城河是文化和组织”?
49:02 创新需要一套强大的方法论,其中可能要摒弃经验主义。当然,反经验主义并非简单地抛弃过去,而是要重新构建一套能让整个组织高效运作的方法。
51:26 过去30年,中国科技产业经历了从“中国制造”到“中国创新”的跃迁。DeepSeek的崛起是否意味着中国企业在全球科技竞赛中迎来了关键转折点?
54:50 随着AI的推理成本大幅下降,和计算速度进一步提升,可能会出现哪些有趣的应用或发展?
【本期相关】
DeepSeek R1的技术报告
从DeepSeek展望AI产业的未来发展
Vol.116 产业观察18|如何成为下一个英伟达:与Mackler季宇聊AI芯片的突围之路
李丰对话季宇:理解英伟达,解构英伟达,挑战英伟达
【制作团队】
主理人:李翔 、李丰
制作及统筹:张英海 (13514156656)、峰小瑞(pr@freesvc.com)
如果你喜欢我们的节目,欢迎你分享到更多的地方,也欢迎你在我们的评论区留言交流。
Information
- Show
- FrequencyUpdated weekly
- Published13 February 2025 at 09:10 UTC
- Length1h 4m
- RatingClean