适逢Sora2问世不到一个月,我快速地尝试了使用Sora2“搓” 了100多个视频,分享一些所思所想给大家,文末放了邀请码,欢迎一起来玩。
节目时间线:
00:00 欢迎与开场:Sora 2 远超预期的使用体验与低失败率
02:00 限制性研究:探索 Sora 2 在资讯内容生成中的限制和失败案例
02:40 限制点1:规避知名的公众人物和名人
03:30 限制点2:国际政治话题被限制
04:00 限制点3, 4:未经授权的“共创”内容及涉及儿童的不安全因素
05:00 Sora 2 高点赞视频类型分析:体育赛事赛点、温馨场景
06:45 高赞视频类型(续):数字虚拟人主播(上半身动作可控)与电影极致质感的自然环境报道(如沙漠、宇宙)
08:30 视频生成流程:需邀请码、使用大模型完善 Prompt(构图、节奏、角色、背景音乐)与每日生产限额(最多30个视频)
10:30 视角对比:国内(中国)对广告和日常 Vlog(如爬金字塔、冲浪)效果的积极评价与内容局限
12:50 视角对比:海外(Reddit)的负面声音——不符**物理规律**的挑战(如滑板技法错误、双马物理)
15:00 国际担忧:“失控感”(Out of Control)与无法辨别 AI 视频真伪的焦虑
17:00 法律与社会应用担忧:在抚养权案件或政治选举中滥用 AI 视频的风险
19:30 个人总结与未来思考:从业者的谨慎乐观态度、监管难度(AI 内容标识)与技术发展的未知性
21:50 核心探讨:大型公司发展视觉生成的终极目标——通过视觉落地(Visual Grounding)提升文本理解力
22:30 Visual Grounding 对文本理解的三大积极影响:深入理解(具象化)、模仿人类学习模式(基于物理世界感知)及技能转移
💡Sora2邀请码:8G5MJH (再次感谢秋芝2046的介绍和分享 她的Youtube channel)
💡论文:Vokenization: Improving Language Understanding with Contextualized, Visual-Grounded Supervision 论文地址 论文讲解
封面图片:Sora2生成视频截图
播客背景音乐:科幻主题风格的音乐 Zager & Evans - In the Year 2525 Youtube link
节目时间线由NotebookLM辅助生成
记得点赞收藏和分享我的播客呀
المعلومات
- البرنامج
- تاريخ النشر٢٦ أكتوبر ٢٠٢٥ في ٣:١٨ ص UTC
- مدة الحلقة٣٠ من الدقائق
- التقييمملائم
