您好,欢迎来到维库电子市场网 登录 | 免费注册
7年
企业信息

深圳市优尚半导体科技有限公司

卖家积分:15001分-16000

营业执照:已审核

经营模式:贸易/代理/分销

所在地区:广东 深圳

企业网站:
http:/www.szyoushang.cn

人气:303576
企业认证
现货认证
企业档案

相关证件:营业执照已审核 

会员类型:

会员年限:7年

林小姐 QQ:2881303317

电话:19194421175

手机:19194421175

阿库IM:

地址:门市:新亚洲电子商城二期N2C161室/公司:深圳市福田区振华路航苑西座9楼902

传真:0755-83047608

E-mail:sales1@skylightelec.com

英伟达再推中国特供AI芯片:没有HBM,价格诱人

发布时间: 2025/5/27 13:39:11 | 23 次阅读

5 月 25 日,据新加坡《联合早报》、路透社等消息,英伟达(NVIDIA)将为中国市场推出一款采用 BlackWell 架构的 “全新特供” AI 芯片,快将于 6 月开始量产。目前,其终命名尚未确定,广发证券在中表示,新GPU可能被称为6000D或B40(以下以“B40”代称)定价在 6500 至 8000 美元之间,远低于此前受美国出口管制的 H20 芯片(1 万至 1.2 万美元)。

据悉,B40 基于英伟达第四代 BlackWell 架构打造,采用台积电 4 纳米工艺制造,整合两个独立的 B200 GPU 芯片,通过 NVLink 5.0 实现 10TB/s 的高速互联。其 AI 算力达到 20 千万亿次浮点运算/秒,推理大语言模型性能比 H100 提升 30 倍,能耗降低至 1/25。

然而,为符合美国出口管制要求,B40 将基于英伟达的 RTX Pro 6000D,并使用传统的 GDDR7 内存,而非更先进的高带宽内存(HBM)。显存带宽被限制在 1.7-1.8TB/s,仅为 H20 芯片(4TB/s)的 42.5%-45%。

此外,新芯片总处理性能(TPP)严格控制在4800以下,不会采用台积电先进的 CoWoS 封装技术,转而采用传统封装工艺。这种 “性能阉割” 策略在满足美国商务部对 “性能密度阈值” 要求的同时,还进一步降低了成本。

在具体参数设计上,第二代 Transformer 引擎支持 4 位浮点计算,可处理数万亿参数的混合模型;第五代 NVLink 实现 1.8TB/s 双向吞吐量,支持多达 576 个 GPU 的无缝协作;RAS 引擎通过 AI 驱动的预防性维护提升可靠性。尽管带宽受限,H20B 仍能在垂类模型训练和推理场景中保持较高效率,例如在 1750 亿参数的 GPT-3 基准测试中,其训练速度是 H100 的 4 倍。

你就说这算不算价格战吧?

英伟达此次推出 B40 的目标是应对中国市场的双重挑战:

一方面,美国对华先进计算芯片的出口管制导致 H100、A100 等产品供应受限;另一方面,华为昇腾 910B、寒武纪思元 590 等国产芯片在政策支持下快速崛起。B40 的定价策略直接瞄准国产芯片的价格带 —— 华为昇腾 910B 单卡售价约 8 万元人民币,而 B40 的 6500-8000 美元定价(约合人民币 4.6 万 - 5.7 万元)形成显著价格优势。

为巩固市场地位,英伟达同步启动 “硬件 %2B 软件” 的生态绑定策略。其 CUDA-X 软件栈已针对 B40 进行深度优化,支持主流深度学习框架如 PyTorch、TensorFlow 的无缝迁移。

此外,英伟达计划与中国合作伙伴共建 AI 训练平台,例如与阿里云合作推出基于B40 的智算集群,提供从芯片到应用的全栈解决方案。这种 “低价硬件 %2B 高价值服务” 的模式,旨在抵消国产芯片在政策支持下的生态建设优势。

消息人士透露,B40样品将于6月交付测试,三季度启动量产,由纬创等厂商负责服务器模组组装。

B40将接受国产替代的强力挑战

B40 的推出对中国 AI 产业格局将产生深远影响。

从短期看,英伟达CUDA生态的兼容性仍是优势,该芯片能缓解国内智算中心对高性能算力的迫切需求。根据 IDC 数据,2025 年中国智能算力市场规模预计达 8690 亿元,其中推理场景占比超 60%。B40 在 FP8 精度下的 3958 TOPS 算力,可满足多数垂类模型的推理需求,尤其适合金融风控、智能客服等对实时性要求较高的场景。

广发证券分析指出,该芯片单精度算力约为旗舰B200的1/7,但通过多卡并行方案(如8卡服务器配置)可实现算力叠加,满足部分大模型推理需求。

然而,长期来看,B40 的市场接受度将面临国产替代的严峻挑战。

华为昇腾 910B 在 FP16 精度下的算力达 320 TFLOPS,超过 H20 的 148 TFLOPS,且通过 MindSpore 框架实现了 “端 - 边 - 云” 全场景覆盖。此外,寒武纪思元 590 支持千卡集群训练,已中标中科院智能计算中心项目。

国产芯片在政策支持下正加速构建自主生态,例如以DeepSeek为代表的本土AI企业已开始测试华为昇腾910B集群,其千亿参数模型训练效率接近A800方案;百度飞桨已实现对昇腾芯片的原生适配,训练效率损失控制在15%以内。

指出,国产芯片需在以下领域加速突破:一是提升芯片架构创新能力,例如龙芯中科的 LoongArch 指令集和寒武纪的 MLUarch 架构;二是完善软件生态,通过开源社区吸引开发者;三是加强产业链协同,例如联合高校、企业共建 AI 算力网络。

地缘政治下的供应链隐忧

美国政府对中国技术发展的限制措施,使得英伟达等美国科技企业在华业务受到冲击。英伟达发言人表示,“在确定新的产品设计并获得美国政府批准之前,英伟达实际上已被挡在中国价值 500 亿美元的数据中心市场门外。”

英伟达 CEO 黄仁勋也曾表示,在目前的出口限制下,H20 所使用的旧 Hopper 架构已无法再进行进一步修改。

2024财年,大中华区贡献了英伟达13%的营收(约171亿美元),其中H20芯片虽受管制,一季度仍斩获超160亿美元订单。但时间来到2025年,在美国政府管制下“英伟达在中国的市场份额已从 2022 年之前的 95% 暴跌至目前的 50%。”

在此背景下,英伟达不得不调整策略,为其重要的市场之一量身定制符合监管要求的芯片。

B40 如果推出,将标志着英伟达在中美科技博弈中的策略调整 —— 从 “性能优先” 转向 “合规优先”。对于中国 AI 产业而言,这既是短期的算力补充,也是长期技术自主的催化剂。

黄仁勋在近期访华时表示:“中国不仅是的消费市场,更是技术创新的重要驱动力。” B40 的市场表现将取决于其能否在合规性与性能之间找到平衡点,而中国 AI 产业的未来则取决于能否在开放合作与自主创新之间走出一条可持续发展之路。这场技术博弈的终局,或许不在芯片本身,而在生态构建与产业协同的深层较量。