电子元器件行业:昇腾超节点释放单卡性能 昇思迭代增强软硬协同
本报告导读:
CloudMatrix 384 超节点单卡性能对标H100,昇思Mindspore 2.6 全面支持类Deepseek V3/R1 MOE架构模型,国产算力芯片预计加速渗透。
投资要点:
投资建议。C loudMatrix 384 超节点发布,其采用新型高速总线升级互联带宽,单卡decode 吞吐对标H100。昇思Mindspore 2.6 全面支持类Deepseek V3/R1 MOE 架构模型,系统吞吐率提升2.8 倍。伴随硬件性能提升与软件架构迭代,国产AI 算力芯片需求有望加速增长。推荐标的:中芯国际、华丰科技、兴森科技、芯碁微装。
硬件:CloudMatrix 384 超节点发布,国产AI 算力基础设施升级。
根据2025 年4 月10 日举办的华为云生态大会,CloudMatrix 384 超节点采用新型高速总线,通过统一内存编制、通信升级互联带宽,有效提升推理性能。根据硅基流动微信公众号,384 超节点可在单用户20TPS 前提下,实现单卡decode 吞吐1920 tokens/s,与H100性能相当。并且CloudMatrix 384 超节点高速互联带宽有望加速国产算力卡向训练场景突破。
软件:昇思发布Mindspore 2.6,加速开发大模型一体化部署方案。
根据2025 年4 月12 日举办的昇思开发者大会,MindSpore 2.6 全面支持类Deepseek V3/R1 MOE 架构模型:(1)支持高性能MOE 预训练,性能提高30%;(2)发布新的后训练学习套件GRPO 等,支持deepseek,千问等模型的GRPO 训练以及DRO/PPO 等算法,支持训推一体;(3)适配支持vLLM 原生接口,支持Deepseek V3/R1 Int8量化,新增10+推理融合大算子,系统吞吐率提升2.8 倍。并且昇思联合北大、openeuler 提供大模型一体化软件方案,整合deepseek、Mindspore、openeuler、VLLM 开源组件,支持大模型快速部署服务。
未来昇思生态将持续演进,预计Mindspore 2.7 将支持大EP 并行能力,实现多模态生成模型Day0 迁移,将进一步加速Altas 800 A3 超节点推理速率。
催化剂:CloudMatrix 384 超节点量产落地
风险提示:昇腾芯片性能测试不及预期;下游客户缩减AI capex
声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: