9月28日,腾讯混元发布并开源首个多模态生图模型“混元图像3.0”,参数规模高达80B。这是首个开源工业级原生多模态生图模型,也是目前参数量最大的开源生图模型,效果对标业界头部闭源模型。
用户访问电脑端腾讯混元官网即可体验混元图像3.0,模型将逐步上线元宝;同时模型权重和加速版本已在Github、Hugging Face等开源社区发布,企业和个人开发者可直接下载并免费使用。
混元图像3.0具备常识并能够利用知识进行推理;同时语义理解准确度高,并具备极致美学质感,能生成真实的高质感图片;可以解析千字级别的复杂语义,生成长文本文字,整体图像生成效果业界领先。
腾讯混元团队透露,混元图像3.0目前的版本仅开放了文生图能力,图生图、图像编辑、多轮交互等版本将于后续发布。
文、视频|记者 王丹阳
图|腾讯混元生成