AI算力秩序重建,Arm走向中心

2025-05-29 16:31:21 来源: 杜芹

当NVIDIA、亚马逊云科技(AWS)、微软等巨头纷纷将AI平台架构迁移至Arm,真正的问题已经不是“Arm能不能替代x86”,而是“x86还能守多久”。在“AI无处不在”的大趋势下,从智能手机到云端AI算力,从软件生态到算力能效的极限优化,Arm——这家计算平台巨头正以看得见的速度走向台前,在人工智能浪潮的推动下,正迎来“第二增长曲线”。
 
在5月22日的媒体沟通会上,Arm高级副总裁兼终端事业部总经理Chris Bergey系统阐述了Arm如何在AI时代实现架构创新、生态强化和性能跃迁——尤其是在端侧智能、AI智能体崛起、算力能效平衡等关键议题上的思考与布局,透露出Arm如何从架构提供者逐步成为“AI计算范式”的塑造者。
 
 
从“边缘”崛起:端侧AI不再是“伪命题”
 
回看过去一年,AI模型的演进不再局限于“更大”,而是在算法压缩、部署优化下,逐步“缩小”并进入端侧。Chris Bergey指出,一年前“端侧AI是否可行”的疑问已经得到了现实的有力回答:智能手机、机器人、交互式智能体等终端正在成为AI部署的前线。
 
仅在过去的18个月内,便有超过150个涵盖语音、图像、文字与视频生成的基础模型面世。原本只存在于云端的 AI 助理,如今也正优先在边缘设备上开发,推动 AI 推理作业由云端转向边缘应用。
 
在这一趋势中,Arm架构凭借低功耗、高效能的天然优势,开始全面占据高地。特别是在异构计算盛行的今天,CPU不再是“通用计算”的代名词,而是AI推理流程中不可或缺的一环。Bergey透露,约70%的AI工作负载仍常驻于CPU之上,这对Arm构建全局协同的AI算力平台提出了更高要求,也释放了巨大的商业价值。
 
更值得关注的是,AI正下沉至更低成本的终端设备,例如售价不足140美元的AI手机开始进入市场。AI在Arm CPU和GPU上都能很好地运行,而这些硬件覆盖了各个价格区间。可以说,Arm正在助力实现“AI普惠”的愿景——让边缘设备成为智能社会的入口。
 
近年来,Arm 架构在 PC 与平板市场的需求大幅成长,预估在 2025 年将占整体出货量的 40%。目前全球大多数主流的应用均已推出适用于 Windows 的 Arm 原生版本,带来更快速、更强大的 AI PC 体验,涵盖聊天机器人、生产力工具等核心应用。联发科技近期推出的 Kompanio Ultra SoC,更进一步提升了 Chromebook 市场的水平,让新一代 Chromebook Plus 设备具备先进 AI 与多媒体能力。
 
此外,NVIDIA 推出的 DGX Spark AI 桌面计算平台也正展现强劲动能。该平台搭载了基于 Armv9 架构 CPU 的 Grace Blackwell 超级芯片,具备支持 2,000 亿参数模型的 AI 计算能力,备受那些致力于打造强大的下一代 AI 模型的开发者与研究人员的关注。
 
 
撕开云计算主战场:Arm突破x86高墙
 
真正让人惊叹的,是Arm在数据中心的突围速度。
 
过去,Arm在服务器市场的份额相对较低。但如今,Arm自信地预测:2025年,出货到头部超大规模云服务提供商的算力中将有近一半基于Arm架构。这一跃迁,不仅说明了Arm架构正愈发受到头部云服务提供商的青睐,也是对Arm能效架构理念的背书。
 
原因不难理解。AI训练和推理所带来的能源压力,正在重塑数据中心架构的设计边界。据Arm预测,AI导致的数据中心能耗已从兆瓦级飙升至吉瓦级,其中半导体设备和机架的能耗占比超过50%。得益于 Arm 对于“每瓦性能”的坚持,相较于其他平台,头部云服务提供商所采用的 Arm 架构芯片可实现高达 40% 的能效提升。在“每瓦性能”成为算力核心指标的时代,Arm天然的能效优势令其成为云服务商自研芯片的首选架构——AWS、微软、谷歌、阿里等已推出基于Arm技术的处理器产品。
 
 
这一趋势被NVIDIA Grace Blackwell进一步放大。作为将CPU和GPU深度耦合的代表性架构,Grace不仅是Arm在AI服务器中的关键突破口,也将其架构正式推入了高性能AI推理与训练的中心战场。在今年COMPUTEX上,NVIDIA也分享了基于 Arm 架构的 NVIDIA Grace CPU 的最新发展势头,该 CPU 在包括埃克森美孚 (ExxonMobil)、Meta 等一系列的实际部署中,为要求苛刻的 AI 工作负载提供了性能和效率的提升。
 
云巨头和NVIDIA的拥抱,这不仅仅是Arm商业层面的胜利,更是AI计算范式的根本转向。
 
软硬结合才是竞争护城河
 
近年来,由于摩尔定律放缓,设计过程中对工艺的定制化需求也持续增长。在此背景下,Arm推出“计算子系统”(CSS),帮助从云端、汽车到终端等不同细分市场的合作伙伴有效提升性能、降低成本,并加快产品上市周期。在去年的 COMPUTEX 展会上,Arm 发布了专为消费电子设备打造的 Arm 终端计算子系统 (CSS for Client),作为旗舰 AI 智能手机与新一代 AI PC 的计算平台。除了带来两位数的IPC性能提升之外,终端 CSS 也为用户带来了实质性效益——应用程序启动更快速、AI 体验更流畅且更持久。
 
而硬件不是AI时代的全部。Chris Bergey在会上坦言:“虽然为AI构建硬件非常具有挑战性,但软件同样至关重要。”Bergey强调,Arm 的真正优势在于目前已有超过 2,200 万名开发者在 Arm 平台上进行开发。
 
Arm去年推出的Kleidi软件库已成为其加速AI工作负载的主力引擎,截至目前安装量已突破80亿次。更关键的是,Kleidi已与多家全球主流AI框架完成集成,包括腾讯混元的Angel等。这让Arm不仅具备硬件底座能力,更在AI开发者生态上形成“正向循环”:芯片出货促进生态繁荣,生态反哺算力平台的持续进化。
 
下一代旗舰CPU Travis:为AI推理而生
 
在移动终端市场,Arm的进攻拓展仍在继续。
 
一年前发布的Arm Cortex-X925已成为多款旗舰平台的核心CPU,其以业界领先的IPC性能,支撑起高性能与低功耗的双重目标。
 
但Arm并未止步。Chris提前剧透:今年晚些时候,Arm将发布下一代旗舰CPU —— 代号Travis。该处理器不仅在Cortex-X925基础上进一步实现两位数的IPC提升;还将首次引入 Armv9的可伸缩矩阵扩展(SME),进一步加速处理 AI 工作负载。
 
 
再叠加Arm精锐超级分辨率技术(Arm ASR),未来一部旗舰手机将具备媲美主机的游戏画质与AI推理能力,是真正意义上的“AI计算终端”。虽然目前Arm尚未涉足数据中心级GPU产品线,但在边缘侧与汽车等市场,其GPU影响力已逐渐起势。
 
结语
 
Arm不造芯片,却正在重塑芯片世界。基于 Arm 架构的芯片出货量迄今已累计超过 3,100 亿颗,广泛应用于消费电子设备、AI 汽车以及 AI 优先的数据中心。其崛起不是来自某款爆款产品,而是架构、生态、能效与软件的系统性胜利。
 
在AI驱动的第二曲线上,Arm并非传统意义上的CPU竞争者,而是“AI计算范式”本身的重要塑造者。Chris在会上提到一句话令人印象深刻:“AI的未来前景广阔,从云端到边缘打造一个无处不在的平台将具有极大的价值。”而Arm,正是这一“平台架构范式”的坚定推动者。
 
我们有理由相信,在不远的未来,AI世界中那块最关键的“底层拼图”,会越来越多地写着:Arm。
责任编辑:admin

相关文章

半导体行业观察
摩尔芯闻

热门评论