华为昇腾新突破:新 AI 芯片算力达 H20 的 2.87 倍,国内首款支持 FP4 推理
Available in: 中文
华为新昇腾 AI 芯片算力达 H20 的 2.87 倍,国内首款支持 FP4 推理,使更大的 LLM 能以更低成本部署,减少中国对 NVIDIA 的依赖。
华为昇腾新突破:新 AI 芯片算力达 H20 的 2.87 倍,国内首款支持 FP4 推理
华为发布了新一代昇腾 AI 处理器,计算性能达到 NVIDIA H20——美国出口管制下可获得的最高端 NVIDIA 芯片——的 2.87 倍。最值得注意的是,这是中国首款支持 FP4(4位浮点)推理的自主设计芯片,缩小了与 NVIDIA 最新 Blackwell 架构的关键能力差距。
性能对比
| 指标 | 华为昇腾(新款) | NVIDIA H20 | 提升 |
|---|---|---|---|
| FP16 算力 | ~580 TFLOPS | ~200 TFLOPS | 2.87x |
| FP4 推理 | ✅ 支持 | ❌ 不支持 | 新能力 |
| 内存带宽 | 未披露 | 4.0 TB/s | 待确认 |
| 工艺 | 中芯国际 7nm(估) | 台积电 4N | - |
| 中国可用 | ✅ 国产 | ✅(受限) | 供应链安全 |
FP4 突破
FP4 推理是使这款芯片具有战略意义的关键创新:
- 4倍内存缩减:在 FP16 下需要 140GB 的 LLaMA 70B 模型在 FP4 下仅需约 35GB
- 实际影响:以前需要 8 块 H20 的 AI 推理可能只需 2 块昇腾芯片
- 与 NVIDIA 并列:NVIDIA 的 Blackwell 是唯一另一个支持 FP4 的架构
- 生态赋能:华为的 CANN 框架现已支持 FP4 量化管线
市场影响
该发布对中国 AI 格局有即时影响:
- 云服务商:阿里云、华为云和百度 AI 云可以提供更有竞争力的推理定价
- 模型开发者:FP4 推理能力使得以更低成本部署更大模型成为可能
- 企业 AI:构建私有大模型部署的公司可以使用国产芯片,无需应对出口限制
- 学术研究:高校获得了不依赖 NVIDIA 的现代推理能力
更大图景:中国的半导体雄心
这款芯片发布是更广泛战略的一部分:
- 中芯国际进步:尽管受到 EUV 光刻限制,中芯国际已通过 DUV 多重曝光实现了 7nm 级别的良率
- 生态建设:华为的 CANN + MindSpore 提供了完整的开发环境
- 市场时机:芯片的推出正值中国 AI 公司面临日益增长的减少 NVIDIA 依赖的压力
- 国际信号:证明了出口管制产生了意想不到的后果——它们加速了国内创新
需要考虑的局限性
尽管标题数字令人印象深刻:
- 软件成熟度:CANN 在库支持和社区方面仍大幅落后于 CUDA
- 制造规模:中芯国际的产能只是台积电的一小部分
- 训练限制:FP4 仅用于推理;训练仍需要更高精度
- 国际可用性:出口管制可能适用于某些市场的这款芯片
来源: 华尔街见闻
← Previous: Musk's Gigafab: The Ambitious Plan to Build 50x Global Chip Capacity for SpaceXNext: n0 Announces noq: QUIC Multipath Implementation in Rust with 40Gbps+ Throughput →
0