AI Odyssey Crosspacific
-
- 科技
-
『AI Odyssey』是一档探讨人工智能科技的播客。在这个节目中,我们会从AI产品、资金、技术,以及中美两大互联网市场之间的机遇和挑战展开讨论。
关于我们:
Lawrence Lou 硅谷科技大厂AI产品经理兼职AI早期投资人
Leo Zhao 硅谷大厂高级机器学习工程师,GenAI LLM发烧友
PongPong 连续创业者,AI初创公司产品负责人
在各大音频平台都能搜到我们,欢迎点击订阅。
-
AI快讯探索 Llama3:Meta 打造的AI革新力作
大家好,欢迎收听本期 GenAI 快讯:
以下是本期摘要:
00:07 - Meta 新推出的开源大模型 Llama3,8B、70B 已开源,405B(还在训练未开源)性能逼近GPT-4
参考内容02:01 - Dwarkesh Patel 对扎克伯格的访谈讨论Llama3 405B模型和AI开源生态系统的重要性
视频地址03:11 - Meta 的无线长文本技术,已开源
论文地址04:21 - OpenAI 更新 Assistant API 的功能,可处理高达10,000个文件
V2 技术文档更新说明05:07 - Claude 3 Opus模型已上线Amazon Bedrock
05:54 - MiniMax发布ABAB 6.5系列模型
06:46 - 斯坦福HAI发布第七个年度AI Index报告
报告地址08:47 - Adobe将引入AI技术到Premiere Pro中,支持OpenAI的Sora和其他模型
官方 sora 演示视频09:19 - 第一AI 程序员 Devin 演示视频“造假”翻车事件
光头哥逐帧分析视频11:18 - 亚马逊人事变动,吴恩达加入董事会
亚马逊官方公告11:57 - 20VC 对 OpenAI CEO Sam 和COO Brad 的访谈
Youtube 访谈视频12:20 - MiniMax创始人讨论其对技术和产品并重策略的看法,以及公司在大模型创业中的地位和策略
以下是《晚点 LatePost》与 MiniMax 创始人闫俊杰的对话以上是本期全部内容,感谢收听,我们下期再会~ -
AI快讯:马斯克的 XAI 发布 Grok1.5,微软巧妙收编 Pi 团队,Stability AI 风雨飘摇
欢迎来到 AI Odyssey。以下是AI领域的最新动态,欢迎收听!
本期内容:
00:02 - XAI 公司推出大模型 Grok-1.5,特点是上下文理解和高级推理能力的提升,计划向早期测试人员和 x 平台现有用户提供;
参考内容01:15 - OpenAI 分享了 Voice Engine 的预览,能够通过输入文本和 15 秒音频样本生成自然语言,目前只在小范围内分享;
参考内容02:10 - OpenAI 的 GPT 4 似乎不再有严格的使用上限,官方提示“Usage limits may apply”;
03:44 - Sam Altman 在 Lex Fridman 的播客中谈论了 OpenAI 的内部风波、对 Musk 的批评看法、Sora 的局限性和 GPT 4 的不足;
播客地址机器之心翻译版05:24 - Business Insider 报道一些投资者对 Sam Altman 的不满;
原文地址06:09 - 微软 CEO Nadella 就科技、企业文化、个人成长和未来趋势的讨论;
视频地址07:46 - 微软向Inflection支付6.5亿美元以获得专利使用与人才团队;
新闻来源09:09 - Stability AI 的 CEO 突然宣布辞职;
官方公告10:22 - Anthropic 公司开发的 AI 语音和音乐生成工具Suno 介绍;
Suno 官网11:43 - 百度将为苹果今年发布的 iOS 和 Mac OS 提供 AI 功能;
12:17 - GTC2024 黄仁勋 和 Transformer 架构的八位提出者的对话;
极客中国原文12:32 - 吴恩达教授在 deeplearning 最新课程:优化 LLM 推理系统;
课程地址12:50- YC W24 AI Starup 项目分布;
Google sheet 地址13:22 - 创业邦发布的 2023 年 AIGC 产业投资报告;
文章地址13:32 -Trustless Labs 发布的 AI + Crypto 项目介绍;
报告地址以上就是本期节目的所有资讯,感谢您的收听,我们下期再见。 -
揭秘AI文生图【下】文生图模型最前沿研究——结构原理、推理加速和评估
大家好。欢迎来到 AI Odyssey。本期播客我们有幸邀请到了文生图领域内的两位专家:林之秋和李嘉琛。两位嘉宾和主播深入探讨了文生图模型的最前沿研究,涵盖了模型的结构原理、推理加速以及评估方法。此外嘉宾还分享了模型架构的细节和优化技巧,以及模型评估的挑战和解决方案。本期内容丰富,为大家提供了一次深入了解文生图模型的机会,相信本期播客能带给大家新的启发和思考。欢迎收听,期待和大家一起探索AI的奥秘。
嘉宾介绍:林之秋:CMU机器人研究所四年级博士,关注vision-language model以及generative AI。Twitter: @ZhiqiuLin
Jiachen Li (李嘉琛, 推特:@JiachenLi11) :加州大学圣塔芭芭拉分校 (UCSB)三年级PhD,主攻文生图模型,机器人控制,多模态学习。Jiachen带队参加了Amazon SimBot Challenge,获得了第二名以及10w美元的奖金。
本期主播:Leo Zhao: 硅谷大厂高级机器学习工程师,GenAI LLM发烧友
Shownotes:00:34 嘉宾自我介绍
02:08 讨论文生图模型的分类:闭源模型和开源模型,以及它们的特点和区别
03:52 探讨闭源模型和开源模型在数据质量和模型架构上的差异
06:06 分析 Diffusion Model (扩散模型)的原理,包括其与 GAN(生成对抗网络)的比较和优化
09:33 解释 Stable Diffusion 模型的特点,包括在潜在空间的生成和文本条件的引入
11:44 详细介绍 Diffusion Process 的理论基础,包括随机微分方程和逆过程的概念
16:00 讨论LCM(一致性模型)在降低推理步骤和保持生成质量方面的作用
20:42 探讨生成模型的评估指标,包括对齐度、质量、人工评估和自动化指标的重要性
27:02 分析现有自动化指标的局限性,包括 CLIP Score 的问题和改进方向
33:29 探索奖励建模在引导生成模型方面的应用和挑战
38:47 讨论不同奖励模型策略对生成模型的影响及训练的挑战
44:06 探讨用于评估和改进生成模型的新方法,包括弱模型指导强模型的潜力
49:44 讨论提高生成模型文本理解能力的重要性及其在专业应用中的潜在应用
54:29 探索用于生成模型评估的新基准和方法,重点关注文本对齐
59:36 讨论合成数据在生成模型训练中的应用及潜在优势
感谢收听,我们下期再会~ -
揭秘AI文生图【上】文生图应用startup从0到1
欢迎收听本期 AI Odyssey,本期我们有幸邀请到了HuHu AI CEO 刘天强,一位经验丰富的连续创业者。在这期节目中,嘉宾不仅分享了他在 AI 领域的创业历程,还深入讨论了关于 AI 产品设计、用户增长策略、以及如何在竞争激烈的市场中找到立足点。无论你是 AI 领域的专业人士,还是对文生图应用充满好奇的听众,这期节目都将为你提供独到的见解和启发。欢迎收听,与我们一起探索 AI 文生图的奥秘!
嘉宾介绍:刘天强:HuHu AI CEO,连续创业者。曾经创立Orbeus并被Amazon收购,后成为Amazon Rekognition的创始架构师。在创立Huhu AI前,曾经是智能家居公司Wyze的CTO (Twitter: @Tianqiang_Liu, xhs: @AI创业中的井叔)
主播介绍:Leo Zhao: 硅谷大厂高级机器学习工程师,GenAI LLM发烧友
产品介绍:Chat Designer
Chat Designer 是HuHu AI 的第一款 AI 产品。支持从文本生成图片,包括肖像图和产品图。用户通过简单的聊天对话即可进行像素级编辑。支持修图工具进行精确调整,轻松创造个性化图像。
HuHU AI
HuHu AI 为各种商业场景提供 AI 设计代理解决方案。
Shownotes 00:32 嘉宾自我介绍,分享连续创业经历 02:10 Chat Designer 的独特之处 02:47 讨论选择生成图应用领域的原因和市场定位 03:44 探讨 AI 产品设计与传统产品设计的异同 05:02 讨论 AI 产品的不确定性和评估标准 06:35 分析 AI 产品的市场定位和宣传策略 07:30 讨论 AI 模型的不确定性 08:02 讨论关于加强AI生成图的控制 09:29 Chat Designer 的目标用户群和市场策略 10:54 用户增长的核心要素和流量获取 13:55 讨论 AI 生图应用的艺术风格和质量评估 16:22 讨论 AI 生图应用的速度、质量和多样性之间的平衡 21:02 分享产品定价策略和收费标准 25:03 分享用户增长策略和口碑效应 32:23 预测生图应用未来发展方向和产品重构计划感谢收听,我们下期再见! -
GenAI快讯:马斯克领航开源大模型Grok
欢迎来到《AI Odyssey》播客。我们将为您带来本周AI领域的最新动态,欢迎收听!
以下是本期内容:
00:05 - 马斯克开源Grok-1
项目地址 github.com01:39 - OpenAI 开源 Transformer Debugger (TDB) 工具
GitHub 链接:github.com03:19 - OpenAI 大模型加持的 Figure 01 机器人
Demo 视频链接04:01 - Devin:Cognition AI 团队发布的首个 AI 软件工程师
05:10 - A16Z 分享 Top100 GenAI ToC 产品
原文链接06:29 - 探索最新 AI 创业公司的 Pitch Deck 网站
官网链接07:26 - Yann LeCun 在 Lex Fridman 播客中的专访内容
视频链接09:21 - 张小珺对王小川的采访
王小川想提出中国AGI第三种可能性感谢收听本期播客,更多精彩内容,请持续关注我们的节目。下期再见! -
GenAI快讯:揭秘马斯克诉讼OpenAI,Claude 3震撼发布
欢迎来到《AI Odyssey》播客。我们将为您带来本周AI领域的最新动态,欢迎收听!
以下是本期内容:
00:49 - 马斯克对OpenAI的诉讼及其影响
外媒链接01:16 - OpenAI回应马斯克诉讼,公开过去8 年的邮件沟通记录
公开链接:openai.com01:54 - OpenAI就CEO被罢免事件的调查结果,Sam重返董事
03:22 - Anthropic发布新的AI模型系列Claude 3
42 页的技术报告《The Claude 3 Model Family: Opus, Sonnet, Haiku》04:00 - Claude 3 Opus模型具有自我认知
05:10 - 前 Google 工程师,AI 创业心路历程分享
原文链接:www.yitay.net07:36 - 张小珺对杨植麟和朱啸虎的专访
月之暗面杨植麟专访:AI不是接下来一两年找到PMF,而是接下来十到二十年如何改变世界朱啸虎讲了一个中国现实主义AIGC故事08:12 - Mini Max融资6 亿美元
感谢您的收听,我们下期再见~