软硬兼施:华为昇腾生态重构千亿市场
创始人
2025-07-01 19:20:29
0

6月末的科技界,一场由华为主导的AI算力变革正掀起产业重构浪潮。继6月20日在东莞举办的华为开发者大会(HDC 2025)发布盘古大模型5.5及新一代昇腾AI云服务后,华为于6月30日正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术。

此举是华为践行昇腾生态战略的又一关键举措,推动大模型技术的研究与创新发展,加速推进人工智能在千行百业的应用与价值创造。

从突破算力瓶颈到开源普惠

“随着大模型训练和推理对算力需求的爆炸式增长,传统架构已难支撑AI代际跃迁。”华为常务董事、华为云计算CEO张平安在HDC大会直言。

其底气源于CloudMatrix 384超节点技术——借助384颗昇腾NPU与192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,单卡推理吞吐量跃升至2300 tokens/s,与非超节点相比提升近4倍。更关键的是,该架构支持“一卡一专家”的混合多专家MoE大模型并行推理,同时,超节点的“一卡一算子任务”可以将MFU(算力有效使用率)提升50%以上。

仅仅十天后,华为将技术红利开放至产业层。

开源的盘古Pro MoE 72B模型在昇腾800I A2芯片上实现单卡1148 tokens/s推理性能,通过投机加速技术更可达1528 tokens/s。值得关注的是,盘古Embedded 7B模型还引入了创新的“快慢思考”双系统:简单问题由快速模式响应,复杂任务自动切换深度推理。

在中文专业领域的知识密集型评测C-Eval(EM)中,盘古Pro MoE 72B模型以C-Eval 91.1分超越业界标杆Qwen3-32B(89.2分),而其激活参数量仅160亿,足以媲美320亿(32B)量级的先进模型。

据SuperCLUE 2025年5月中文开源模型排行榜,盘古72B在开源排行榜中位列第五,总分为58.75分,超越Qwen3-14B、Qwen3-8B,仅次于DeepSeek-R1满血版、DeepSeek-V3满血版以及Qwen3-32B和235B。

与此同时,技术突破正转化为切实的经济效益。海螺水泥(600585)应用盘古预测大模型后,实现熟料3天、28天的强度精准预测;在宝武钢铁(600019),基于盘古大模型研发的高炉大模型使出铁温度合格率稳定在90%以上,一个高炉单日节约燃料20吨。

更深刻的变革发生在制造现场。中国石油(601857)基于盘古CV大模型构建的昆仑大模型,攻克输送管亚毫米级缺陷识别难题,效率提升40%的同时降低人工强度25%;广汽集团(601238)则与华为云合作,利用盘古多模态大模型将复杂场景Corner case复原时间压缩至分钟级,支撑智能驾驶端到端模型“两天一迭代”。

国产替代进入深水区

华为此次开源直指产业生态命脉。昇腾AI云服务已吸引科大讯飞(002230)、360(601360)、中科院等1300余家客户。

而市场反应的背后是算力经济学的根本转变。盘古Pro MoE在昇腾300I Duo服务器上实现极具性价比的模型推理方案,并在千亿内总参数模型中处于领先地位。纵观华为AI战略,一条“芯片-框架-模型-应用”的垂直整合路径清晰可见。

首先是硬件层方面,华为云新一代昇腾AI云服务,基于CloudMatrix超节点可通过云数据中心支持16万卡级联;框架层方面,MindSpore针对MoE架构深度优化,训练效率提升30%;模型层方面,盘古5.5大模型可覆盖NLP/CV/科学计算五大领域,服务30多个行业500余场景落地;应用层方面,ModelArts Versatile平台支持分钟级Agent开发,CodeAtrs Doer使软件研发端到端效率提升40%以上。

6月30日,华为还在极简全闪数据中心Pro+发布会上,推出了OceanStor Dorado 3000全新一代融合闪存存储系统,专为AI时代的商业市场需求设计,旨在大幅提升存储与应用数据的处理速度。

据悉,OceanStor Dorado 3000最大支持2TB内存、1600块SSD,提供高达8PiB(1PiB=1024TB)可用容量,单系统最大可扩展到16个控制器;除此之外,还提供业界领先的SAN、NAS、S3一体化A-A双活保障关键业务极致体验。两个数据中心可同时提供业务,实现业务均衡负载和资源就近访问;通过FastWrite,跨站点写IO交互次数从2次减少到1次,双活业务性能提升25%,保障业务连续性达99.99999%。

“昇腾和盘古证明存在英伟达(NVDA)之外的可行替代方案”,有业内人士分析称。随着华为盘古大模型的开源和新一代融合闪存存储系统的发布,一场关于AI时代基础设施话语权的争夺,才刚刚开始。

相关内容

热门资讯

东风汽车集团申请阻燃柔性固态电... 金融界2025年1月31日消息,国家知识产权局信息显示,东风汽车集团股份有限公司申请一项名为“一种阻...
中端性能机大乱斗:加米耀酷真,... 近期,中端手机市场迎来了多款新品,包括一加Ace 5、REDMI K80、荣耀GT、真我Neo 7以...
360智脑张向征:构建安全可信... 人工智能的加速发展,有力推动了社会的数智化转型;与此同时,带来的相关安全风险也日益凸显。近日,在北京...
无机房电梯楼层显示器异常解决指... 电梯 无机房电梯楼层显示器异常怎么办? 别急,本文将为您详细解答。首先,我们要了解无机房电梯楼层显示...
我市特步5G工厂入选国家5G工... 日前,工业和信息化部发布《关于2024年5G工厂名录的公示》,我市特步5G工厂入选国家5G工厂名录,...
卫星化学获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示卫星化学(002648)新获得一项实用新型专利授权,专利名为“...
自动驾驶+跟踪巡逻+现场抓捕 ... 近日,在浙江温州的闹市区,特警巡逻队带着一台球形机器人一起巡街,引来不少路人的关注。 球形“机器警察...
原创 3... 一、iQOO 12 参考价格:2659元(12G+256G)。 性能强劲,游戏无忧 首先不得...
联想宣布旗下AIPC个人智能体... DoNews2月7日消息,近日,联想宣布个人智能体“小天”已接入DeepSeek,除了目前可以在联想...
2025年消脂设备产业数据报告 消脂仪是医学美容领域的医疗器械。 它使用激光和微波等设备根据其波长向真皮/皮下平面发射能量; 通过加...