英特尔至强6+,重回C位的“算力指挥官”

2026-06-08 15:35:08 来源: 杜芹
点击
在过去几年的AI狂欢中,当行业谈论AI工作负载时,对话几乎完全被GPU和加速器等“独奏者”所垄断。但当大模型开始从小范围的“炫技”走向大规模的商业落地,当被动的、单轮的AI推理演变为主动、自主、以目标为导向的智能体(Agentic AI)时代,算力世界的权力天平,正在悄然发生位移。
 
2026年6月5日在“英特尔至强6+新品发布会暨数据中心创新日,一场别开生面的交响乐视频拉开了”的序幕。大屏幕上,英特尔的吉祥物站在一方特殊的“指挥台”上,气定神闲地编排、调度着整支宏大的交响乐团。而那方指挥台,正是英特尔数据中心CPU——至强(Xeon)处理器。
 
 
 
“系统编排、交响乐团以及乐团指挥之间的相似之处,是显而易见的。”英特尔公司全球副总裁兼首席市场营销官 Brett Hannath 步入舞台中央,用这个精妙的隐喻,点破了当前全球智算产业正在悄然发生的范式转移。
 
 
英特尔公司全球副总裁兼首席市场营销官 Brett Hannath
 
如果说大模型训练时代,行业追求的是把GPU推到极致;那么Agentic AI时代,行业需要的是让整套基础设施像交响乐一样协同运转。而在这场新的交响乐里,CPU重新站上指挥台,并不意外。
 
从独奏到交响,CPU为何重回C位?
 
“前沿AI模型的训练在很大程度上就像是一场GPU独奏协奏曲。但随着AI推理和Agentic AI的兴起,我们现在需要整个计算平台协同作战。这是一场涵盖多种工作负载、所有组件共同参与的真正的‘交响乐’。” Brett Hannath 的这段话,道出了算力供需两侧的底层变革。
 
从被动、单轮的传统交互,到主动、自主、以目标为导向的智能体,Agentic AI 的运行包含了一个持续的循环:感知、规划、执行并优化动作。这意味着海量并发、多步骤的工作流,本质上都是CPU密集型的。跨域编排、工具执行、上下文处理和沙箱治理,无一不需要CPU施展铁腕。
 
英特尔市场营销集团副总裁、中国区总经理郭威用一组震撼的数据印证了这一趋势的凶猛:
 
“到2030年,新一代智能终端、智能体等应用的普及率将突破90%,到2031年活跃智能体数量将达到3.5亿个。今年一季度,算力需求更是爆涨417%。”
 
需求的井喷直接引发了供应链的震荡。郭威透露,从去年下半年开始,市场便出现了CPU缺货的信号。背后核心驱动力正是Agentic AI、物理AI及强化学习对通用算力的极度渴望。据第三方机构调查,数据中心内CPU与GPU的部署比例已从过去的1:8、1:4,演进到如今的1:2。
 
 
英特尔市场营销集团副总裁、中国区总经理郭威
 
在这场技术体系架构的重塑中,通用计算的基石依然是x86。IDC预测,到2030年,全球新部署的服务器中,每10台里依然会有8台采用x86架构。
 
“我们的首要任务,始终是为合作伙伴和客户提供最务实、最贴近真实业务场景的 CPU。” Brett 表示。而当天完整亮相的至强6家族——追求极致能效、为高密度智能体系统定制的至强6+(能效核),与追求极致性能、稳居GPU系统机头处理器份额第一的至强 6(性能核),正是英特尔掏出的两张王牌。
 
至强6+处理器:Intel 18A制程与288核的“暴力美学”
 
作为当天的核心主角,代号为 Clearwater Forest 的至强6+处理器在中国市场正式发布,其参数堪称对高密度计算的一场“暴力美学”式诠释。
 
英特尔数据中心集团产品总监 Kira Boyko 详细拆解了这款高密算力引擎的底层密码:它内置了288个能效核,末级缓存高达576MB(较上一代提升5倍以上)。得益于最新的 Intel 18A 制程工艺,并行业首创性地融合了两大颠覆性技术——PowerVia 背面供电降低功耗、提升性能一致性;RibbonFET 全环绕栅极晶体管则将待机功耗拉至新低。12个基于18A的计算模块,通过全新的 Foveros Direct 3D 封装技术堆叠在3个有源基底上,再利用EMIB技术连接2个I/O模块,实现了芯片间海量带宽的无缝传输。
 
在投资回报率(ROI)上,英特尔也秀出了一组极具吸引力的数据:与第二代至强相比,至强6+可实现高达 9:1 的服务器整合率,每线程每瓦性能提升45%,帮助数据中心在寸土寸金的当下,显著缩减物理空间与功耗。
 
在 hyper-scale 云计算的真实战场上,至强6+已展现出强大的落地生命力。腾讯云星星海产品架构师黎洁分享道,基于软硬协同优化,腾讯云构建了支持288v CPU的超大规格虚机实例。
 
“硬件隐患的主动规避是保障业务连续性的关键。”黎洁指出。腾讯云通过打磨热迁移技术,将构建脏页速度提升20倍,并结合自研故障预测系统,实现了故障预判到主动调度的全自动闭环。在春节QQ红包抗住3倍瞬时流量、腾讯会议8天扩容100万核的极限场景中,至强平台构筑的算力底座均表现得坚如磐石。
 
而All in AI的金山云,则基于至强6+推出了全新的SE10实例。金山云云计算研发负责人杨峰表示:“CPU从辅助配角变成了系统的核心……实际上变成了指挥者和大脑,它思考任务怎么执行,任务决策怎么执行。”在AI Agent场景下,SE10实例支持百级Agent实例批量托管,部署密度提升80%以上,重新定义了单服务器的性能边界。
 
存、连、保:三位一体构筑智算纵深
 
英特尔数据中心集团副总裁、中国区总经理陈葆立强调,重塑智算中心不能仅靠孤立的算力,必须具备算力、存力、连接力和保障力的“四力”综合优势。
 
 
英特尔数据中心集团副总裁、中国区总经理陈葆立
 
第一,雄浑的存力:迎击KV Cache的容量风暴
 
随着AI推理走向主流,长上下文、大并发催生了KV Cache容量的爆发性增长。“1个用户、100万Token上下文,KV Cache就需要9.6GB。”新华三集团存储产品线首席产品经理王其勇指出,全球用于AI推理的闪存到2031年将达到惊人的1251亿TB。
 
为此,新华三推出了AI原生存储Uni-Stor解决方案(X20000),借助至强6实现了单节点200GB/s的带宽,使Token生产效率最高提升10倍。未来,新华三还将通过KV语义接口、全局HASH直存、DPU硬件加速三大技术,打造“全程无收费站的高速公路”,将时延拉低至微秒级。
 
同时,阿里云智能集团块存储研发总监谷跃胜指出,Agent无规律的毫秒级负载需要应用内存与持久化内存的高速切换。在与英特尔的协同优化中,阿里云采用全新的QAT加速引擎替代纯软件压缩,压缩带宽暴涨400%,同时释放了75%的通用CPU核数。
 
第二,灵动的连接力:打破生态绑定的开放网络
 
网络已不再仅仅是数据通道,而是系统效率的阀门。英特尔推出了全新的 E835 以太网解决方案,功耗仅为12W,支持1x200G、2x100G等多种端口弹性配置。
 
在现代智算中心向大规模Scale-out(水平扩展)演进的过程中,英特尔坚持开放标准。基于 Falcon 协议 强大的硬件端到端控流与容错能力,企业仅需使用标准以太网交换机,就能达到专用无损网络的性能,彻底摆脱了被单一厂商技术锁定的行业宿命,让集群尾部延迟降低了约40%。
 
第三,沉稳的保障力:数据“可用而不可见”
 
“向云演进”是大模型的长期趋势,但安全与合规是悬在企业头顶的达摩克利斯之剑。至强6提供的硬件级机密计算解决方案 TDX,在CPU层面创建了受保护的信任域。
 
“大模型落地即淘汰的私有化痛点,逼着企业走向公有云。”火山引擎AICC产品研发负责人张尧表示。火山引擎AICC结合英特尔TDX,为企业大模型应用构建了可信的“安全屋”。通过芯片级可信、全栈安全基线与端到端机密性,确保模型权重不被窃取,用户隐私不外泄,真正实现了数据“可用而不可见”。
 
此外,在超大规模集群中,小概率的静默数据错误(SDE)会引发性能风暴。至强6凭借全面的RAS(可靠、可用、可维护)功能,实现了“五个九”(99.999%)的运行可用性。火山引擎与英特尔合作表明,利用RAS能力,其线上年化宕机率大幅降低了50%以上。
 
生态力,最具价值的“最后一力”
 
在发布会的尾声,陈葆立将英特尔扎根中国40余年的成果,归结为最具价值的“最后一力”——生态力。
 
除了至强CPU,英特尔还展示了其专为AI推理与Agentic AI工作负载打造的新一代数据中心GPU —— Crescent Island。它拥有最高480GB的LPDDR5x大容量内存,仅需8张卡即可在FP8精度下运行1.6T参数的DeepSeek-V4。更重要的是,它整卡功耗控制在350W TDP,支持现有风冷数据中心与标准PCIe部署,无需任何昂贵的基础设施改造。
 
作为英特尔紧密的生态盟友,云尖信息副总裁张欢军在现场带来了专为Agentic AI时代量身定制的硬件成果。从单机支持32卡、面向下一代PCIe 6.0准备的模块化服务器7A86,到最高可支持6万个智能体的20万瓦全液冷盲插CPU集群柜,云尖将芯片的“四力”转化为了商用阵地的“产品力、技术力、制造力、服务力”。
 
“未来AI的竞争,除了模型能力的提升,更需要构建高效的AI智算中心,从系统层面以优异的成本提升Token的供给。”陈葆立的话掷地有声。
 
结语
 
从x86的持久生命力,到18A制程的硬核工艺,再到存储、网络、机密计算的全面进化,英特尔和它的朋友圈正在把AI算力从“高高在上的概念”变成“人人可用、账单可控”的生产力工具。毕竟,技术讲得再天花乱坠,能帮企业省下真金白银、稳稳接住泼天流量,才是硬道理。
责任编辑:duqin

相关文章

半导体行业观察
摩尔芯闻

热门评论