电子元器件行业:昇腾超节点释放单卡性能 昇思迭代增强软硬协同

证券之星 2025-04-19 10:43:34
股市要闻 2025-04-19 10:43:34 阅读

本报告导读:

    CloudMatrix 384 超节点单卡性能对标H100,昇思Mindspore 2.6 全面支持类Deepseek V3/R1 MOE架构模型,国产算力芯片预计加速渗透。

    投资要点:

    投资建议。C loudMatrix 384 超节点发布,其采用新型高速总线升级互联带宽,单卡decode 吞吐对标H100。昇思Mindspore 2.6 全面支持类Deepseek V3/R1 MOE 架构模型,系统吞吐率提升2.8 倍。伴随硬件性能提升与软件架构迭代,国产AI 算力芯片需求有望加速增长。推荐标的:中芯国际、华丰科技、兴森科技、芯碁微装。

    硬件:CloudMatrix 384 超节点发布,国产AI 算力基础设施升级。

    根据2025 年4 月10 日举办的华为云生态大会,CloudMatrix 384 超节点采用新型高速总线,通过统一内存编制、通信升级互联带宽,有效提升推理性能。根据硅基流动微信公众号,384 超节点可在单用户20TPS 前提下,实现单卡decode 吞吐1920 tokens/s,与H100性能相当。并且CloudMatrix 384 超节点高速互联带宽有望加速国产算力卡向训练场景突破。

    软件:昇思发布Mindspore 2.6,加速开发大模型一体化部署方案。

    根据2025 年4 月12 日举办的昇思开发者大会,MindSpore 2.6 全面支持类Deepseek V3/R1 MOE 架构模型:(1)支持高性能MOE 预训练,性能提高30%;(2)发布新的后训练学习套件GRPO 等,支持deepseek,千问等模型的GRPO 训练以及DRO/PPO 等算法,支持训推一体;(3)适配支持vLLM 原生接口,支持Deepseek V3/R1 Int8量化,新增10+推理融合大算子,系统吞吐率提升2.8 倍。并且昇思联合北大、openeuler 提供大模型一体化软件方案,整合deepseek、Mindspore、openeuler、VLLM 开源组件,支持大模型快速部署服务。

    未来昇思生态将持续演进,预计Mindspore 2.7 将支持大EP 并行能力,实现多模态生成模型Day0 迁移,将进一步加速Altas 800 A3 超节点推理速率。

    催化剂:CloudMatrix 384 超节点量产落地

    风险提示:昇腾芯片性能测试不及预期;下游客户缩减AI capex

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
最新发布
今日焦点