CPU重返数据中心C位 “某国内大模型厂商CPU需求提高了5倍”
Computex 2026电脑展期间,巨头们再次强调了一个行业趋势:通过CPU、GPU、存储与网络高效协同构建系统级能力,才能真正释放AI规模化应用的价值。当AI迈向智能体时代,由于既要承载高密度CPU集群中的数据预处理、编排调度与任务分解等工作,又要在GPU智算服务器集群中承担主控CPU角色,CPU正重返现代AI基础设施的中心。
日前,占据“主场优势”的英特尔已推出了Intel 18A制程首款数据中心CPU,同时据财联社记者观察,芯片厂商均瞄准了AI浪潮中数据中心CPU的机遇,各巨头的“混战”已打响。
“随着AI Agent兴起,CPU在AI架构中重要性提升,需求明显增加,近四周以来,有多家公司CEO打电话联系,希望取得更多CPU。”英特尔CEO陈立武透露。
英特尔中国区技术部总经理高宇在最新接受财联社记者采访时表示,“今天,我们如果把AI数据中心当作未来世界的超级工厂的话,它的产出是Token,它的生产机器有三台:一台是GPU集群,一台是CPU集群,一台是高性能存储集群。驱动这三台机器的都是同一个东西,英特尔至强处理器。”
英伟达CEO黄仁勋则在媒体见面会上表示,英伟达首款自研数据中心CPU Vera将比公司的GPU更受欢迎,因为Vera CPU在处理信息方面起着至关重要的作用,“Vera CPU将成为我们新的主要增长动力。”
CPU重返数据中心C位
今年以来,一组预测数据已经多次出现在媒体报道中:Agentic AI需求带动下,数据中心领域CPU和GPU的配比将从传统的1:8,慢慢变成1:4、1:2甚至1:1。
“我们其实并没有严格计算过,但是我认为我们不要把它看作是数据中心内部,或者是单台服务器内部的比例,应该从全球的业务量去看。”谈及上述比例,腾讯云计算产品运营总监周驰告诉财联社记者。
韩中工商联盟总会AI存储专委会委员长、芯枢科技总经理林美炳向财联社记者表示,实际上两类芯片无硬性固定架构配比,可随业务需求灵活调配。
林美炳向财联社记者举例称,AMD Helios机柜中CPU与GPU配比为1:4,英伟达GB300NVL72机柜中CPU与GPU配比为1:2。另外,谷歌第8代TPU采用了1颗自研CPU搭配2颗TPU芯片的配比设计。
英特尔数据中心集团副总裁兼中国区总经理陈葆立还介绍,某国内领先的大模型厂商,从去年到今年CPU需求提高了5倍。“这是来自真实客户的反馈,至于说未来到底是不是1:1甚至更高,由于AI的发展还处于早期阶段,目前还很难下定论。”
无论数据中心CPU和GPU的配比重构实际进展几何,CPU重返现代AI基础设施中心,已成行业共识。
IDC预测,2026-2027年,企业场景中的活跃智能体数量同比增长超200%。而财联社记者从业内采访获悉,在智能体工作流中,绝大多数任务编排与工具调用相关的负载都运行在CPU上。
具体而言,CPU负责以下几大核心场景:信息检索与工具执行,比如网页搜索、数据库查询、各领域相关API调用;流程编排与指令控制,包括智能体工作流的规划、管理及各模块之间的依赖关系处理;数据处理,如输入解析、摘要生成(如词法)、中间结果的处理。在许多智能体工作负载中,CPU密集型操作往往占据了执行期的绝大部分,很大程度上影响了系统的端到端延迟。
林美炳告诉财联社记者,CPU在AI时代回归核心地位的核心逻辑在于计算负载的结构性变化。传统AI计算以GPU为主导,但AI Agent的普及推动交互任务激增,涉及查询、调度、编排及互联互通等环节,这些任务主要依赖CPU执行,导致其在端到端延迟中占比高达80%-90%。
美银证券预估,到2030年,全球服务器CPU市场规模将上看1250亿美元,年复合增长率31%,其中AI服务器CPU占比将高达77%。
财联社记者另从英特尔方面了解到,行业当前对数据中心CPU有三大核心诉求:提升性能密度,在减少机架空间的同时处理更多的任务;提升每瓦性能,降低TCO;为关键业务部署提供高可靠性保障。
英特尔执行副总裁兼数据中心事业部(DCG)总经理Kevork Kechichian介绍,数据中心的客户需求广泛,工作负载分为三大类:需要高密度计算的横向扩展(Scale-out)工作负载和网络,需要平衡性能和数据吞吐量的通用工作负载,计算密集型和AI工作负载(包括训练和推理)。其中,AI工作负载在过去几年快速增长,除了基础工作负载及当前以训练为主的“前沿模型”(主要依赖加速器和GPU进行训练)之外,越来越多需求正向推理侧迁移。
芯片巨头“混战”打响
刚刚落下帷幕的Computex 2026电脑展,是业内多款重量级硬件新品的集中发布窗口,亦成为了芯片巨头们宣告“混战”打响的最佳舞台。
此次,Intel 18A制程首款数据中心CPU至强6+处理器正式推出。同时,英特尔面向中小企业入门级服务器还推出了12核至强6300系列处理器,目前已通过主流OEM厂商正式发售。
从具体参数看,至强6+拥有288颗能效核,支持8000 MT/s的DDR5内存及576MB末级缓存(LLC)。同时,至强6+采用了PowerVia技术(实现更短、更直接的供电路径,从而降功耗)、RibbonFET技术(增强性能一致性)。
财联社记者还获悉,英特尔推出了一项硬件功能Intel AET(英特尔应用能效遥测技术),支持数据中心运营商在工作负载层级实时查看CPU核心的功耗与运行状态,进而实现能效更优的资源编排、精准成本分摊,并针对负载优化应用落地能效激励机制。
至强6+已在电信网络基础设施中进行测试,并开始配置到数据中心系统中,整个生态系统均有可用平台。其中包括来自华硕、戴尔、爱立信、技嘉、慧与(HPE)、联想、超微等厂商所提供,或在其方案中采用的服务器、网络和集成解决方案。另外,腾讯云基于全栈自研的星星海服务器,即将推出搭载至强6+的新一代云服务器实例。
同时,英特尔、SambaNova和富士康宣布计划构建基于至强处理器的机架级AI基础设施,并在Computex 2026现场展示了已具备量产条件的机架。按合作计划,富士康将为全新机架级AI基础设施提供系统集成支持,并计划制造一款高CPU密度的机架级基础设施变体。
近期,AMD首席执行官苏姿丰也在台北表示,CPU市场过去三四年时间里增长并不明显,增速可能在3%-4%左右,产业聚焦GPU方面。随着AI朝着推理和智能体方向发展,预计未来五年CPU市场每年将增长超过35%,且这一领域的需求非常强劲。
智能体时代CPU价值被重估,至强及其竞品均迎来了机会。
不过陈葆立告诉财联社记者,现在市场非常火爆,(市场需求)是所有供应商都无法快速满足的。
他进一步谈到:“过去两个月我跟我的工程师团队做了很多讨论。有友商一出来就宣称单靠一种CPU架构就能‘打天下’。后来我们研究后发现其实答案是否定的。第一,智能体应用以数量为优先,很多新的智能体在后台做各种工作,这非常适合核数多但单核性能不需要太高的处理器。第二,当智能体真正开始做事情的时候,所触发的任务负载完全不同。比如数据库极度消耗性能,当你需要调用100次数据库时,背后调用的其实是100个高性能核(P核),而不是普通的轻量核。”
林美炳对财联社记者表示,CPU市场将形成“传统x86双雄+ARM新锐瓜分增量”的三足鼎立格局。英伟达Vera、ARM AGI为代表的ARM架构快速渗透,三年内服务器ARM CPU份额有望实现大幅提升。同时,英伟达、谷歌、AMD等大厂定制化CPU、AI芯片及网络芯片,推动生态分化;ARM自身芯片聚焦通用场景,与厂商定制产品形成互补,共同推动生态演进。
Kevork Kechichian预计,到2030年,现有数据中心底层架构仍将持续发挥价值,且会承载近50%工作负载。
谈及ARM和x86的竞争,英特尔方面称,“ARM从2009年就开始布局服务器领域,多年来形成自身生态。但在今天的应用场景中,预计到2030年,全球在网运行的服务器部署量超过8000万台,其中80%依然是x86服务器。这得益于x86架构多年的积累、产品的成熟度、广泛的生态以及产业链的支持。”
当前,英特尔也在数据中心GPU战场积极进攻。英特尔最新披露了其下一代数据中心GPU(代号“Crescent Island”)的更多技术细节。据悉,Crescent Island基于Xe 3P架构,LPDDR5x显存可提供480 GB容量,支持从原生FP4/MXFP4到FP64的广泛数据类型和微缩放格式,专为智能体系统打造,解决功耗与内存瓶颈。
财联社记者注意到,市场亦关注服务器CPU市场供需变化带来的价格波动。
此前有市场消息指出,英特尔5月对服务器CPU进行了年内的第三次提价,今年来累计涨价约30%。不过,财联社记者问及CPU定价问题,公司方面未作明确回应。
林美炳表示,全球CPU供需紧俏格局或将延续至2027-2028年,其中商用服务器CPU年内价格稳步上行,行业确存供需缺口,但缺口幅度低于市场极端预判,终端需求扩容节奏整体理性可控。
(文章来源:财联社)
声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: