发布两款显卡，英特尔GPU更进一步

2025-05-20 16:02:13 来源: 李寿鹏

点击

因为人工智能的火热，GPU成为全球当之无愧的宠儿。这也正是英特尔近年来频频加码这条赛道的原因之一。

自2022年发布“锐炫（ARC）”显卡品牌以来，英特尔发布了多个系列的显卡，并从多维度对锐炫进行升级。例如在去年年底，英特尔就带来了面向消费级客户的“锐炫B”系列，并同时推出了XeSS 2技术，为终端用户带来更好的体验。值得一提的是，在锐炫B系列上，还有一个被广泛认可硬件——AI引擎XMX。

在谈及这个产品设计背后的逻辑时，英特尔副总裁兼客户端显卡总经理Vivian Lien在日前开幕的Computex 2025上表示，设计一个能用于游戏和媒体相关工作的GPU本身就是非常复杂，但在看到AI成为重要工作负载之后，英特尔毅然为这系列GPU集成了AI引擎。“我们希望这系列GPU在能够满足打游戏的消费机需求之余，还能完成AI等专业级任务。”Vivian Lien总结说。

正是在这种思路指导下，英特尔锐炫Pro应运而生。Vivian Lien指出，锐炫Pro是随着锐炫第一代面世的，最初针对的是使用Graphics的专业人士。现在，英特尔希望将锐炫Pro带到Inference和Workstation的市场。于是，我们看到了英特尔在Computex 2025上带来的两款基于X^e2架构的锐炫 Pro新品B60和B50。

虽然在iGPU市场有了丰富的经验。但在独立显卡市场，英特尔可以称得上是新兵。

上次英特尔尝试打入显卡行业时，它发现自己开发的产品更适合处理繁重的计算工作负载。因此，英特尔将其作为至强融核 (Xeon Phi) 产品线发布，该产品线从 2010 年一直运营到 2020 年。

在当时，Xeon Phi 无疑是成功的，并被多个重大项目采用。但后来，英特尔取消 Xeon Phi 系列，转而使用英特尔 Arc 图形架构，通过英特尔 Arc Pro 系列在该领域展开竞争。这些年来，英特尔也一直致力于其 Arc GPU 平台的研发。目前，该公司为游戏玩家提供 B 系列芯片，以及面向工作站的 A 系列芯片，不过这些芯片更侧重于企业图形和视觉功能，而非 AI。

现在，随着集成更大内存和专为 AI 设计功能的Arc Pro B50 和 B60 的发布，英特尔进一步扩充了公司显卡的势力范围。

面向图形工作站的B50

据英特尔中国客户端计算产品事业部高级产品总监徐金平 (JP Xu)介绍，B50面向的主是主流的工作站工程设计应用，其配置特点主要是大显存，配备 16GB VRAM、16 个 X^e2 核心、128个XMX引擎，INT8 性能高达 170 TOPS。作为对比，锐炫 Pro A50的显存仅为6G。

“在性能方面，我们在英特尔锐炫 Pro产品线上有一个特点有专门的Pro Driver，和没有Driver的产品相比，仅仅从Driver层面，运行SpecView的性能提升幅度达到10%达到2.5倍。此外，PCIe Gen 5速度的提升也会带来10%-20%的性能提升。”徐金平 (JP Xu)接着说。

因为采用了半宽半高双槽位设计，英特尔将其称其为紧凑型显卡，虽然它采用了双插槽散热方案，但显卡本身的长度并不比它所插入的 PCIe x16 插槽长多少。它的功耗同样很低，不到 70 瓦，这意味着它不需要 PCIe 插槽提供的额外功率来运行。更重要的是，它的价格很实惠，仅为 299 美元。

在英特尔锐炫产品管理高级总监Qi Lin看来，正因为拥有如此高端的配置，在将锐炫 Pro B50推向零售市场后，是可以和消费级显卡进行竞争的。“即使在消费级显卡领域，也很难在这个价位段找到具备16GB显存和如此性能的产品。因此，我们认为这款产品无论是与消费级显卡竞争，还是与同类型的工作站显卡竞争，都具有显著的优势。”Qi Lin接着说。

值得一提的是，Arc Pro B50 系列还获得了领先内容创作应用程序的全面认证和验证。对于一款针对于消费机的显卡来说，这是无比重要的。

面向推理工作站B60

对于英特尔锐炫 Pro B60所专注的AI市场。众所周知，当前人工智能领域，随着模型规模持续扩张，对显存容量的需求也日益增长。“以7B参数规模的模型为例，若采用FP16进行推理，则至少需要16GB显存；而对于70B参数规模的模型，即使采用INT4量化，也需要超过30GB显存，若采用FP16，则显存需求将超过100GB。”徐金平 (JP Xu)举例说。

显而易见，大模型推理对显存容量提出了严峻挑战，这也是英特尔为锐炫 Pro B 60集成了24G显存的原因之一。

据英特尔介绍，这个大显存使 Arc Pro B60 在 AI 工作流程中比 Nvidia RTX 2000 Ada 和 Nvidia RTX 5060Ti 等配备 16 GB 内存的 GPU 具有显著的性能优势。作为一款定位为“推理工作站 GPU”的全尺寸产品，英特尔Arc Pro B 60总板载功率为 120W 至 200W。之所以拥有如此宽泛的功率范围，是因为该 GPU 将由包括但不限于华擎、蓝戟、Lanner、铭瑄、傲世、Senao和撼与科技等合作伙伴提供，涵盖各种型号和尺寸。

在英特尔发言人看来，推理工作站使中小型企业能够在本地运行和编纂其专有技术，并在本地使用其数据，从而避免与第三方服务共享。

针对市场对大显存容量的迫切需求，英特尔还设计了高效的多显卡互联方案，这也正是英特尔锐炫Pro B60专业显卡的一大亮点。据介绍，通过这种方式，开发者可以做到4张显卡甚至是8张显卡在一个工作站上。

为了实现这个目标，英特尔在底层做了一些软件的工作，具体而言就是做了GPUDirect Peer-to-Peer技术。其原理就是在GPU之间拷贝数据可以直接拷贝，不需要CPU参与进来，从而优化软件和整个系统。英特尔还用了一个叫张量并行算法的并行技术，把很大的大语言模型平均切分到4张或者是8张卡上进行推理，然后把结果合并输出给用户。

“以上都是我们通过软件来实现的。”徐金平强调。

推理工作站，大有可为

在英特尔看来，“推理工作站”系统具有巨大的市场潜力，因为它能满足不同的需求，（如图形设计工作站）。从其特性来看，推理工作站具有广阔的发展前景。徐金平表示，推理工作站的优势首先体现在其部署安全，数据无需上传至云端，可在本地进行处理；其次，推理工作站能提供一站式解决方案，将所有软件置于容器中，帮助客户解决问题，易于设置；第三，推理工作站可以灵活配置不同数量的显卡，易于扩展；最后，从成本效益方面来看，推理工作站具有显著优势。

有见及此，英特尔推出了一个命名为Battlematrix的项目。徐金平表示，这本质是一个推理工作站平台，基于PCIe 5.0的至强平台通信。根据英特尔的设想，该平台可在系统中提供多达 8 个英特尔 Arc Pro GPU，并支持高达 192 GB 的 VRAM。据英特尔称，这使其能够运行 70B+ 参数及以上的模型。

这里展示的是一个基于至强处理器的系统，配备多张显卡。我们的验证工作从单张显卡、两张开始，最高配置可达八张锐炫Pro B60显卡，提供高达192GB的显存，能够运行70B参数以上的模型。

而为了解决这个设计带来的软件部署复杂性问题，英特尔采用了一个容器化方案——在容器内部对大语言模型进行了包括Linux软件栈的支持、验证以及分阶段的软件发布等大量的优化。其整体软件栈如下图所示。

徐金平表示，之所以这样做，是因为在企业级解决方案中软件层级繁多。如果每一层都由客户自行开发，将这些软件组件整合在一起是一项非常复杂的工作。任何不匹配（例如版本不匹配、兼容性不匹配）都可能导致用户花费大量时间进行Debug，或者需要英特尔提供支持。

因此，英特尔将所有软件栈和版本进行匹配，并在容器内完成验证。这样，客户可以轻松地一键部署整个软件栈，并将精力集中在上层应用开发。

写在最后

英特尔总结说，这两款GPU针对AEC（建筑、工程、施工）和推理工作站进行了优化，并通过大量ISV认证和优化的软件提供稳定可靠的性能。英特尔锐炫Pro B系列GPU在Windows上兼容消费级和专业级驱动程序，在Linux上支持容器化的软件栈，该软件栈可以简化AI部署，并支持逐步升级和功能优化。通过将高显存容量与关键软件兼容性相结合，英特尔锐炫Pro B系列为创作者和AI开发者提供了可扩展的、经济高效的解决方案。

“专业人士在使用GPU时，要求有三点：产品必须要能够非常的坚固、非常的稳定以及相融性要非常好。而英特尔锐炫 Pro产品这三点都涵盖了。”Vivian Lien最后说。

责任编辑：Ace

申请专栏作者

: 半导体行业观察

: 摩尔芯闻

发布两款显卡，英特尔GPU更进一步

相关文章

最新新闻

热门文章本日 七天 本月

热门评论

热门搜索

发布两款显卡，英特尔GPU更进一步

相关文章

最新新闻

热门文章 本日 七天 本月

热门评论

热门搜索

热门文章本日七天本月