AI算力新宠:超节点引领“万卡协同”时代
在AI浪潮的推动下,大模型的发展对算力提出了高要求,促使算力集群进入“万卡协同”时代。传统算力架构已难以满足需求,行业需要技术革新。在此背景下,超节点(SuperPod)——英伟达提出的Scale Up解决方案,凭借其高性能、低成本、高能效等优势,成为全球科技巨头的新战场。
据中科院物理所介绍,超节点通过内部高速总线互连,支撑并行计算任务,加速GPU之间的参数交换和数据同步,缩短大模型训练周期。在2025世界人工智能大会期间,中国企业在超节点领域全面开花,标志着算力集群正式迈入“万卡协同”时代。
超节点成AI算力“新宠”,究竟好在哪里?业内人士指出,相较于传统方案Scale Out,Scale Up在性能、成本、组网、运维等方面存在优势,而超节点就是Scale Up的最佳方案。壁仞科技OCS超节点项目相关负责人董朝锋表示,超节点架构通过深度整合GPU资源,已成为支撑演进的关键技术路径。
董朝锋指出,传统风冷AI服务器的功率密度已逼近极限,散热和供电挑战巨大。超节点通过液冷等先进散热技术,将数十甚至上百个计算单元整合在一个高度集成的机柜或机组中,提升算力密度和能源效率(PUE)。以光跃LightSphere X为例,该方案可显著缩短训练时间、降低算力成本,推动上海本地光芯片、液冷技术、GPU模组等产业的协同发展。
中信建投研报对超节点市场前景持乐观态度,指出超节点作为产业趋势,已被众多服务器选为下一代方案,且大部分方案采用铜连接作为主要承载载体。当前,通信网络中常见的连接方案包括光通信和高速电通信,无源DAC成为实现短距离传输的优秀解决方案。目前的铜缆已实现224G以太网SerDes高速通信技术升级,短距离传输性价比突出。
业界主流的超节点方案主要包括私有协议方案和开放组织方案两种。在英伟达方案中,GB200 NVL72服务器采用大量的铜连接作为机柜内部通讯方式。而计算托盘内同样采用大量铜连接作为服务器内的GPU芯片互联。在开放协议中,以太网技术(ETH)为基础,拥有最多的参与企业。
超节点开放标准方面,比较有代表性的是由开放数据中心委员会(ODCC)主导、中国信通院与腾讯牵头设计的ETH-X开放超节点项目。该机构提到,国内字节、阿里、腾讯新一代服务器分别采用超节点设计,预期将进一步带动铜连接整体市场空间。
面对超节点这一算力新领域,国内科技企业积极布局。华为在超节点领域进展显著,发布昇腾384超节点,实现业界最大规模的384卡高速总线互联。在2025世界人工智能大会上,华为首次展示了为昇腾384超节点真机,并且获评“WAIC镇馆之宝”。
除了昇腾384之外,大会上,曦智科技联合壁仞科技、中兴通讯推出全球首个分布式光互连光交换GPU超节点解决方案——光跃LightSphereX,并获世界人工智能大会最高奖项——SAIL奖。与此同时,曦智科技与沐曦合作的光互连电交换超节点方案也在会上首次公开亮相。
而燧原科技的云燧ESL超节点系统,在测试中表现出良好性能,单节点最高64卡全带宽互联,采用液冷方案。沐曦发布的旗舰GPU曦云C600,支持MetaXLink超节点扩展技术。此外,摩尔线程已经建立了全栈AI智算产品线,提出构建新一代AI训练基础设施,为AGI时代打造生产先进模型的“超级工厂”。
在业内人士看来,当单点突破升维为体系化竞争力,中国超节点技术正在为全球人工智能发展铺设一条兼具性能与包容性的新赛道,其价值有望持续释放。
(文章来源:21世纪经济报道)
声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: