财中社 孙语彤 2025-07-01 18:06 7122阅读
市场背后是算力经济学的根本转变。盘古Pro MoE在昇腾300I Duo服务器上实现极具性价比推理方案,并在千亿内总参数模型中处于领先地位。华为AI战略“芯片-框架-模型-应用”的垂直整合清晰可见。
6月末的科技界,一场由华为主导的AI算力变革正掀起产业重构浪潮。继6月20日在东莞举办的华为开发者大会(HDC 2025)发布盘古大模型5.5及新一代昇腾AI云服务后,华为于6月30日正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术。
此举是华为践行昇腾生态战略的又一关键举措,推动大模型技术的研究与创新发展,加速推进人工智能在千行百业的应用与价值创造。
从突破算力瓶颈到开源普惠
“随着大模型训练和推理对算力需求的爆炸式增长,传统架构已难支撑AI代际跃迁。”华为常务董事、华为云计算CEO张平安在HDC大会直言。
其底气源于CloudMatrix 384超节点技术——借助384颗昇腾NPU与192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,单卡推理吞吐量跃升至2300 tokens/s,与非超节点相比提升近4倍。更关键的是,该架构支持“一卡一专家”的混合多专家MoE大模型并行推理,同时,超节点的“一卡一算子任务”可以将MFU(算力有效使用率)提升50%以上。
仅仅十天后,华为将技术红利开放至产业层。
开源的盘古Pro MoE 72B模型在昇腾800I A2芯片上实现单卡1148 tokens/s推理性能,通过投机加速技术更可达1528 tokens/s。值得关注的是,盘古Embedded 7B模型还引入了创新的“快慢思考”双系统:简单问题由快速模式响应,复杂任务自动切换深度推理。
在中文专业领域的知识密集型评测C-Eval(EM)中,盘古Pro MoE 72B模型以C-Eval 91.1分超越业界标杆Qwen3-32B(89.2分),而其激活参数量仅160亿,足以媲美320亿(32B)量级的先进模型。
据SuperCLUE 2025年5月中文开源模型排行榜,盘古72B在开源排行榜中位列第五,总分为58.75分,超越Qwen3-14B、Qwen3-8B,仅次于DeepSeek-R1满血版、DeepSeek-V3满血版以及Qwen3-32B和235B。
与此同时,技术突破正转化为切实的经济效益。海螺水泥(600585)应用盘古预测大模型后,实现熟料3天、28天的强度精准预测;在宝武钢铁(600019),基于盘古大模型研发的高炉大模型使出铁温度合格率稳定在90%以上,一个高炉单日节约燃料20吨。
更深刻的变革发生在制造现场。中国石油(601857)基于盘古CV大模型构建的昆仑大模型,攻克输送管亚毫米级缺陷识别难题,效率提升40%的同时降低人工强度25%;广汽集团(601238)则与华为云合作,利用盘古多模态大模型将复杂场景Corner case复原时间压缩至分钟级,支撑智能驾驶端到端模型“两天一迭代”。
国产替代进入深水区
华为此次开源直指产业生态命脉。昇腾AI云服务已吸引科大讯飞(002230)、360(601360)、中科院等1300余家客户。
而市场反应的背后是算力经济学的根本转变。盘古Pro MoE在昇腾300I Duo服务器上实现极具性价比的模型推理方案,并在千亿内总参数模型中处于领先地位。纵观华为AI战略,一条“芯片-框架-模型-应用”的垂直整合路径清晰可见。
首先是硬件层方面,华为云新一代昇腾AI云服务,基于CloudMatrix超节点可通过云数据中心支持16万卡级联;框架层方面,MindSpore针对MoE架构深度优化,训练效率提升30%;模型层方面,盘古5.5大模型可覆盖NLP/CV/科学计算五大领域,服务30多个行业500余场景落地;应用层方面,ModelArts Versatile平台支持分钟级Agent开发,CodeAtrs Doer使软件研发端到端效率提升40%以上。
6月30日,华为还在极简全闪数据中心Pro+发布会上,推出了OceanStor Dorado 3000全新一代融合闪存存储系统,专为AI时代的商业市场需求设计,旨在大幅提升存储与应用数据的处理速度。
据悉,OceanStor Dorado 3000最大支持2TB内存、1600块SSD,提供高达8PiB(1PiB=1024TB)可用容量,单系统最大可扩展到16个控制器;除此之外,还提供业界领先的SAN、NAS、S3一体化A-A双活保障关键业务极致体验。两个数据中心可同时提供业务,实现业务均衡负载和资源就近访问;通过FastWrite,跨站点写IO交互次数从2次减少到1次,双活业务性能提升25%,保障业务连续性达99.99999%。
“昇腾和盘古证明存在英伟达(NVDA)之外的可行替代方案”,有业内人士分析称。随着华为盘古大模型的开源和新一代融合闪存存储系统的发布,一场关于AI时代基础设施话语权的争夺,才刚刚开始。