谷歌刚发布的纳米香蕉(Nano banana)图像模型背后的团队访谈。
谷歌 DeepMind 团队成员介绍 Gemini 原生图像生成模型更新,展示其生成和编辑能力的巨大飞跃,如按自然语言指令生成、编辑图像,能保持场景一致性,探讨文本渲染、评估指标、与图像理解能力的关联及实际应用,还对比了与 Imagine 模型的差异,回顾从 2.0 到 2.5 版本的改进,提及未来在智能性、事实性等方面的发展方向。
来源:https://www.youtube.com/watch?v=H6ZXujE1qBA&t=65s
信息
- 节目
- 频率半周一更
- 发布时间2025年8月28日 UTC 23:46
- 长度10 分钟
- 分级儿童适宜