2026 年 4 月 24 日,中国 AI 算力领域迎来里程碑突破:深度求索发布新一代开源大模型 DeepSeek-V4 预览版,同步宣布完成对华为昇腾 910B、950 系列 AI 芯片的全栈深度适配—— 从模型训练到推理全流程,均可脱离英伟达 CUDA 生态,在昇腾平台高效稳定运行,实现 “国产大模型 + 国产 AI 芯片 + 国产框架” 完全自主可控闭环,彻底打破英伟达在全球 AI 算力的长期垄断。
DeepSeek-V4 在代码、数学推理、通用对话等核心指标达全球顶尖,支持千亿参数高效训练 / 推理。此次适配并非简单兼容,而是基于昇腾达芬奇架构、CANN 异构计算、MindSpore 框架,对算子、计算图、内存调度、通信机制全面优化,实现与英伟达 A100/H100 相当的训练效率与推理性能,部分场景能效比更优。测试显示,昇腾 950 集群上,DeepSeek-V4 千亿参数训练速度达 H100 集群 90% 以上,推理延迟降 15%,满足大规模商用部署。华为同步发布昇腾 Atlas 350 加速卡(搭载 950PR),提供高性能、低成本推理算力,形成 “芯片 + 框架 + 模型” 一体化方案。
这一突破的核心意义,是打破英伟达 CUDA 生态 “护城河”。过去十年,英伟达凭借 GPU 硬件、CUDA 框架、软件生态深度绑定,垄断全球 90% 以上 AI 训练 / 推理算力,形成 “用 AI 必用英伟达” 格局。这种垄断带来高昂成本(H100 单价超 3 万美元、供不应求),更有供应链安全、技术封锁、数据安全风险 —— 美国持续限制高端 GPU 对华出口,国内 AI 企业面临 “缺芯少魂” 困境,制约产业发展。而昇腾 + DeepSeek-V4 闭环,让中国拥有完全自主的 AI 算力底层技术栈:芯片(昇腾)、框架(CANN/MindSpore)、模型(DeepSeek-V4)全部国产化,从根本上解决算力 “卡脖子” 问题。
落地将全面激活国产 AI 算力生态:吸引百度文心、阿里通义、字节豆包等加速适配昇腾,推动国产大模型与算力深度融合,形成规模化应用;带动昇腾产业链上下游协同,包括芯片设计、代工(中芯国际)、先进封装、服务器、软件工具、应用开发,构建完整国产 AI 算力链,创造巨大产业价值。对全球格局,打破英伟达独大,形成 “英伟达 + AMD + 华为昇腾” 多元竞争,降低全球 AI 算力成本、推动普惠;为其他国家提供非英伟达选择,促进 AI 产业去中心化、多元化发展。
华为昇腾负责人表示,将持续优化 CANN/MindSpore 兼容性、易用性,降低适配门槛,计划 2026 年底适配国内 90% 主流开源大模型。DeepSeek 创始人称,将与华为深度合作,优化模型 - 算力协同,推动 DeepSeek-V4 在昇腾平台大规模商用,赋能千行百业智能化。
当前,国产 AI 算力生态从 “单点突破” 走向 “系统闭环”、从 “可用” 走向 “好用”,进入规模化商用关键期。随着昇腾产能释放、生态完善、模型适配深化,国产算力将逐步替代英伟达 GPU,成为中国 AI 产业核心支撑,推动中国从 AI 应用大国迈向算力强国。
价格透明 省钱省心
扫一扫 立即咨询