9月18日,华为全联接大会2025在上海开幕,华为副董事长、轮值董事长徐直军公布了华为自研昇腾芯片的最新进展,首次披露包括昇腾950PR、昇腾950DT、昇腾960及970系列在内的多款AI芯片详细路标。他表示,面向大模型训练与推理需求的爆发式增长,华为正以“一年一代、算力翻倍”的节奏持续推进昇腾芯片迭代。更值得关注的是,华为推出基于灵衢互联技术的Atlas 950超节点,支持8192张昇腾卡,号称“全球最强超节点”,预计2026年四季度上市。
徐直军坦言,自DeepSeek开源大模型引发行业震动以来,华为收到大量客户反馈并加速技术回应。他宣布CANN编译器、Mind系列工具链及openPangu大模型全面开源,强调“昇腾硬件持续变现,开源生态同步构建”。业内分析指出,华为超节点技术正重新定义AI算力基础设施范式,从“单卡性能竞争”迈入“系统级效率突围”的新阶段。
芯片路标首度公开,950/960/970三代齐发
“我很确定地告诉大家,昇腾芯片将持续演进,为中国乃至世界的AI算力构筑坚固根基。”徐直军说道。他在演讲中首次系统披露了华为昇腾芯片未来三年的技术规划,涵盖四个核心型号。
据他介绍,华为即将推出Ascend 950系列,包括两款芯片:950PR与950DT。它们采用共Die设计,新增支持FP8/MXFP8/MXFP4等低精度格式,算力较上一代大幅提升,互联带宽达到2TB/s,较Ascend 910C增长2.5倍。特别值得注意的是,华为自研了两种HBM内存——HiBL 1.0和HiZQ 2.0,分别针对Prefill推理/推荐场景和Decode/训练场景进行优化。950PR将于2026Q1推出,950DT则计划在2026Q4上市。
更长远布局上,徐直军透露,Ascend 960将在2027年四季度推出,各项指标相比950翻倍,并支持华为自研HiF4格式,在4bit精度实现上“业界最优”。而Ascend 970则预计在2028年亮相,FP8/FP4算力、互联带宽等指标将再度全面提升,进一步巩固华为在高性能AI芯片领域的竞争力。
“从Ascend 950开始,我们以几乎一年一代、算力翻倍的速度持续演进”,徐直军强调,华为的目标是围绕更易用、更多数据格式、更高带宽等方向构建AI算力根基。
超节点+集群全面升级,自研灵衢协议开放构建生态
除了芯片,徐直军还带来了华为在超节点与集群技术方面的重磅更新。徐直军认为,超节点在物理上由多台机器组成,但逻辑上以一台机器学习、思考、推理。华为发布了最新超节点产品 Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点,分别支持8192及15488张昇腾卡,在卡规模、总算力、内存容量、互联带宽等关键指标上全面领先,在未来多年都将是全球最强算力的超节点。
基于超节点,华为同时发布了全球最强超节点集群,分别是Atlas 950 SuperCluster和 Atlas 960 SuperCluster,算力规模分别超过50万卡和达到百万卡,是当之无愧的全世界最强算力集群。徐直军表示,基于全球最强算力的超节点和集群,华为对于为人工智能的长期快速发展提供可持续且充裕算力,充满信心。
同时,华为率先把超节点技术引入通用计算领域,发布全球首个通用计算超节点TaiShan 950 SuperPoD,结合GaussDB分布式数据库,能够彻底取代各种应用场景的大型机和小型机以及Exadata数据库一体机,将成为各类大型机、小型机的终结者。
华为基于三十多年构筑的联接技术能力,通过系统性创新,突破了大规模超节点的互联技术巨大挑战,开创了面向超节点的互联协议灵衢,徐直军宣布华为将开放灵衢2.0技术规范,欢迎产业界伙伴基于灵衢研发相关产品和部件,共建灵衢开放生态。徐直军强调:“华为将以基于灵衢的超节点和集群持续满足算力快速增长的需求,推动人工智能持续发展,创造更大的价值。”
文、图|记者 潘亮