51 min

编码人声:GPT-4o 只是对话式 AI 的冰山一角,背后隐藏了哪些新机会?‪ ‬ 津津乐道

    • Society & Culture

GPT-4o 只是「对话式 AI 」(conversational AI) 的冰山一角。
同期发布的 Project Astra 还演示了对话式 AI 和可穿戴硬件结合的可能。
更早些,hume.ai 上线了能解读 53 种不同情绪的「共情语音接口」(EVI),发布了一档实时交互式 AI 播客。
ChatTTS 让更多人体验到会笑会停顿,几乎与真人无异的语音合成技术。
投资机构 a16z 近期发布报告,创立了「Voice AI Agent」的投资新赛道并高呼:「是时候重新发明通话了!」
技术上实现 《Her》 的「最后一步」是什么?创业者如何利用现有技术能力满足用户?哪些场景最可能诞生真实付费需求?
本期节目,嘉宾将从模型开发者、实时互动从业者、AI 陪伴玩具创业者的不同视角,探讨「对话式 AI」的边界,分享实践中看到的新机会。
有嘉宾说:人工智能实现 human like 的最后一步,是允许 AI 与人类拥有平等地位:如果你希望 AI 像人,那就请允许 AI 可以随时地回应你也打断你,聆听你也忽略你……
如果是这样,你愿意吗?
【本期主播与嘉宾】张栋,SpeechGPT 作者,SpeechGPT 是一个端到端的语音模型。
王乐,Folotoy 创始人,AI 陪伴对话玩具创业者。
李忻玮,声网 AI 算法工程师,《从零开始学扩散模型》作者,Hugging Face 中文社区成员。
白宦成,全流程工程师,AI 产品经理,RTE 开发者社区布道师,《编码人声》主播。
【听友福利】欢迎在评论区留言,分享你对 GPT-4o 的看法,或者对最有潜力的对话式 AI 场景的预测。我们将抽出一位送出魔性的 Folotoy 仙人掌 AI 玩具一份(价值 398 元)。
【相关信息】一起探索人和 AI 的新连接方式!RTE 开发者社区将在 6 月 22 日、23 日,联合 Founder Park 在北京举办线下的 AGI Playground 活动,边玩边探索 AGI 和 RTE 实时互动的新可能。加入社区微信群,还可以提前获取活动消息,抽免费活动门票。关注「RTE 开发者社区」微信公众号,在后台回复「小助手」即可入群。
【制作团队】后期 / 卷圈监制 / 姝琦产品统筹 / bobo联合制作 / RTE开发者社区
关于「编码人声」「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。
RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。社区于2023年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——· 零一万物 01.AI 开源负责人 @林旅强 Richard· FreeSWITCH 中文社区创始人 @杜金房· 小红书音视频架构负责人 @陈靖
本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。
RTE 开发者社区 | 公众号:RTE开发者社区 | 津津乐道播客官网 | 版权声明 | 评论须知 | 加入听友群

GPT-4o 只是「对话式 AI 」(conversational AI) 的冰山一角。
同期发布的 Project Astra 还演示了对话式 AI 和可穿戴硬件结合的可能。
更早些,hume.ai 上线了能解读 53 种不同情绪的「共情语音接口」(EVI),发布了一档实时交互式 AI 播客。
ChatTTS 让更多人体验到会笑会停顿,几乎与真人无异的语音合成技术。
投资机构 a16z 近期发布报告,创立了「Voice AI Agent」的投资新赛道并高呼:「是时候重新发明通话了!」
技术上实现 《Her》 的「最后一步」是什么?创业者如何利用现有技术能力满足用户?哪些场景最可能诞生真实付费需求?
本期节目,嘉宾将从模型开发者、实时互动从业者、AI 陪伴玩具创业者的不同视角,探讨「对话式 AI」的边界,分享实践中看到的新机会。
有嘉宾说:人工智能实现 human like 的最后一步,是允许 AI 与人类拥有平等地位:如果你希望 AI 像人,那就请允许 AI 可以随时地回应你也打断你,聆听你也忽略你……
如果是这样,你愿意吗?
【本期主播与嘉宾】张栋,SpeechGPT 作者,SpeechGPT 是一个端到端的语音模型。
王乐,Folotoy 创始人,AI 陪伴对话玩具创业者。
李忻玮,声网 AI 算法工程师,《从零开始学扩散模型》作者,Hugging Face 中文社区成员。
白宦成,全流程工程师,AI 产品经理,RTE 开发者社区布道师,《编码人声》主播。
【听友福利】欢迎在评论区留言,分享你对 GPT-4o 的看法,或者对最有潜力的对话式 AI 场景的预测。我们将抽出一位送出魔性的 Folotoy 仙人掌 AI 玩具一份(价值 398 元)。
【相关信息】一起探索人和 AI 的新连接方式!RTE 开发者社区将在 6 月 22 日、23 日,联合 Founder Park 在北京举办线下的 AGI Playground 活动,边玩边探索 AGI 和 RTE 实时互动的新可能。加入社区微信群,还可以提前获取活动消息,抽免费活动门票。关注「RTE 开发者社区」微信公众号,在后台回复「小助手」即可入群。
【制作团队】后期 / 卷圈监制 / 姝琦产品统筹 / bobo联合制作 / RTE开发者社区
关于「编码人声」「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。
RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。社区于2023年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——· 零一万物 01.AI 开源负责人 @林旅强 Richard· FreeSWITCH 中文社区创始人 @杜金房· 小红书音视频架构负责人 @陈靖
本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。
RTE 开发者社区 | 公众号:RTE开发者社区 | 津津乐道播客官网 | 版权声明 | 评论须知 | 加入听友群

51 min

Top Podcasts In Society & Culture

Off The Record with Sanny Ntayombya
The Long Form with Sunny Ntayombya
Why Won't You Date Me? with Nicole Byer
Team Coco & Nicole Byer
What Now? with Trevor Noah
Spotify Studios
Philosophize This!
Stephen West
Where Should We Begin? with Esther Perel
Esther Perel Global Media
Affaires sensibles
France Inter

More by DAO

编码人声
DAO
叫卖图
DAO
厂长来了
DAO
津津有味
DAO
串台
DAO
品质生活
DAO