发布两款显卡,英特尔GPU更进一步
2025-05-20
16:02:13
来源: 李寿鹏
点击
因为人工智能的火热,GPU成为全球当之无愧的宠儿。这也正是英特尔近年来频频加码这条赛道的原因之一。
自2022年发布“锐炫(ARC)”显卡品牌以来,英特尔发布了多个系列的显卡,并从多维度对锐炫进行升级。例如在去年年底,英特尔就带来了面向消费级客户的“锐炫B”系列,并同时推出了XeSS 2技术,为终端用户带来更好的体验。值得一提的是,在锐炫B系列上,还有一个被广泛认可硬件——AI引擎XMX。

在谈及这个产品设计背后的逻辑时,英特尔副总裁兼客户端显卡总经理Vivian Lien在日前开幕的Computex 2025上表示,设计一个能用于游戏和媒体相关工作的GPU本身就是非常复杂,但在看到AI成为重要工作负载之后,英特尔毅然为这系列GPU集成了AI引擎。“我们希望这系列GPU在能够满足打游戏的消费机需求之余,还能完成AI等专业级任务。”Vivian Lien总结说。

正是在这种思路指导下,英特尔锐炫Pro应运而生。Vivian Lien指出,锐炫Pro是随着锐炫第一代面世的,最初针对的是使用Graphics的专业人士。现在,英特尔希望将锐炫Pro带到Inference和Workstation的市场。于是,我们看到了英特尔在Computex 2025上带来的两款基于Xe2架构的锐炫 Pro新品B60和B50。

虽然在iGPU市场有了丰富的经验。但在独立显卡市场,英特尔可以称得上是新兵。
上次英特尔尝试打入显卡行业时,它发现自己开发的产品更适合处理繁重的计算工作负载。因此,英特尔将其作为至强融核 (Xeon Phi) 产品线发布,该产品线从 2010 年一直运营到 2020 年。
在当时,Xeon Phi 无疑是成功的,并被多个重大项目采用。但后来,英特尔取消 Xeon Phi 系列,转而使用英特尔 Arc 图形架构,通过英特尔 Arc Pro 系列在该领域展开竞争。这些年来,英特尔也一直致力于其 Arc GPU 平台的研发。目前,该公司为游戏玩家提供 B 系列芯片,以及面向工作站的 A 系列芯片,不过这些芯片更侧重于企业图形和视觉功能,而非 AI。
现在,随着集成更大内存和专为 AI 设计功能的Arc Pro B50 和 B60 的发布,英特尔进一步扩充了公司显卡的势力范围。
面向图形工作站的B50
据英特尔中国客户端计算产品事业部高级产品总监徐金平 (JP Xu)介绍,B50面向的主是主流的工作站工程设计应用,其配置特点主要是大显存,配备 16GB VRAM、16 个 Xe2 核心、128个XMX引擎,INT8 性能高达 170 TOPS。作为对比,锐炫 Pro A50的显存仅为6G。

“在性能方面,我们在英特尔锐炫 Pro产品线上有一个特点有专门的Pro Driver,和没有Driver的产品相比,仅仅从Driver层面,运行SpecView的性能提升幅度达到10%达到2.5倍。此外,PCIe Gen 5速度的提升也会带来10%-20%的性能提升。”徐金平 (JP Xu)接着说。

因为采用了半宽半高双槽位设计,英特尔将其称其为紧凑型显卡,虽然它采用了双插槽散热方案,但显卡本身的长度并不比它所插入的 PCIe x16 插槽长多少。它的功耗同样很低,不到 70 瓦,这意味着它不需要 PCIe 插槽提供的额外功率来运行。更重要的是,它的价格很实惠,仅为 299 美元。
在英特尔锐炫产品管理高级总监Qi Lin看来,正因为拥有如此高端的配置,在将锐炫 Pro B50推向零售市场后,是可以和消费级显卡进行竞争的。“即使在消费级显卡领域,也很难在这个价位段找到具备16GB显存和如此性能的产品。因此,我们认为这款产品无论是与消费级显卡竞争,还是与同类型的工作站显卡竞争,都具有显著的优势。”Qi Lin接着说。
值得一提的是,Arc Pro B50 系列还获得了领先内容创作应用程序的全面认证和验证。对于一款针对于消费机的显卡来说,这是无比重要的。

面向推理工作站B60
对于英特尔锐炫 Pro B60所专注的AI市场。众所周知,当前人工智能领域,随着模型规模持续扩张,对显存容量的需求也日益增长。“以7B参数规模的模型为例,若采用FP16进行推理,则至少需要16GB显存;而对于70B参数规模的模型,即使采用INT4量化,也需要超过30GB显存,若采用FP16,则显存需求将超过100GB。”徐金平 (JP Xu)举例说。
显而易见,大模型推理对显存容量提出了严峻挑战,这也是英特尔为锐炫 Pro B 60集成了24G显存的原因之一。

据英特尔介绍,这个大显存使 Arc Pro B60 在 AI 工作流程中比 Nvidia RTX 2000 Ada 和 Nvidia RTX 5060Ti 等配备 16 GB 内存的 GPU 具有显著的性能优势。作为一款定位为“推理工作站 GPU”的全尺寸产品,英特尔Arc Pro B 60总板载功率为 120W 至 200W。之所以拥有如此宽泛的功率范围,是因为该 GPU 将由包括但不限于华擎、蓝戟、Lanner、铭瑄、傲世、Senao和撼与科技等合作伙伴提供,涵盖各种型号和尺寸。

在英特尔发言人看来,推理工作站使中小型企业能够在本地运行和编纂其专有技术,并在本地使用其数据,从而避免与第三方服务共享。
针对市场对大显存容量的迫切需求,英特尔还设计了高效的多显卡互联方案,这也正是英特尔锐炫Pro B60专业显卡的一大亮点。据介绍,通过这种方式,开发者可以做到4张显卡甚至是8张显卡在一个工作站上。

为了实现这个目标,英特尔在底层做了一些软件的工作,具体而言就是做了GPUDirect Peer-to-Peer技术。其原理就是在GPU之间拷贝数据可以直接拷贝,不需要CPU参与进来,从而优化软件和整个系统。英特尔还用了一个叫张量并行算法的并行技术,把很大的大语言模型平均切分到4张或者是8张卡上进行推理,然后把结果合并输出给用户。
“以上都是我们通过软件来实现的。”徐金平强调。
推理工作站,大有可为
在英特尔看来,“推理工作站”系统具有巨大的市场潜力,因为它能满足不同的需求,(如图形设计工作站)。从其特性来看,推理工作站具有广阔的发展前景。徐金平表示,推理工作站的优势首先体现在其部署安全,数据无需上传至云端,可在本地进行处理;其次,推理工作站能提供一站式解决方案,将所有软件置于容器中,帮助客户解决问题,易于设置;第三,推理工作站可以灵活配置不同数量的显卡,易于扩展;最后,从成本效益方面来看,推理工作站具有显著优势。

有见及此,英特尔推出了一个命名为Battlematrix的项目。徐金平表示,这本质是一个推理工作站平台,基于PCIe 5.0的至强平台通信。根据英特尔的设想,该平台可在系统中提供多达 8 个英特尔 Arc Pro GPU,并支持高达 192 GB 的 VRAM。据英特尔称,这使其能够运行 70B+ 参数及以上的模型。

这里展示的是一个基于至强处理器的系统,配备多张显卡。我们的验证工作从单张显卡、两张开始,最高配置可达八张锐炫Pro B60显卡,提供高达192GB的显存,能够运行70B参数以上的模型。
而为了解决这个设计带来的软件部署复杂性问题,英特尔采用了一个容器化方案——在容器内部对大语言模型进行了包括Linux软件栈的支持、验证以及分阶段的软件发布等大量的优化。其整体软件栈如下图所示。

徐金平表示,之所以这样做,是因为在企业级解决方案中软件层级繁多。如果每一层都由客户自行开发,将这些软件组件整合在一起是一项非常复杂的工作。任何不匹配(例如版本不匹配、兼容性不匹配)都可能导致用户花费大量时间进行Debug,或者需要英特尔提供支持。
因此,英特尔将所有软件栈和版本进行匹配,并在容器内完成验证。这样,客户可以轻松地一键部署整个软件栈,并将精力集中在上层应用开发。
写在最后
英特尔总结说,这两款GPU针对AEC(建筑、工程、施工)和推理工作站进行了优化,并通过大量ISV认证和优化的软件提供稳定可靠的性能。英特尔锐炫Pro B系列GPU在Windows上兼容消费级和专业级驱动程序,在Linux上支持容器化的软件栈,该软件栈可以简化AI部署,并支持逐步升级和功能优化。通过将高显存容量与关键软件兼容性相结合,英特尔锐炫Pro B系列为创作者和AI开发者提供了可扩展的、经济高效的解决方案。
“专业人士在使用GPU时,要求有三点:产品必须要能够非常的坚固、非常的稳定以及相融性要非常好。而英特尔锐炫 Pro产品这三点都涵盖了。”Vivian Lien最后说。
自2022年发布“锐炫(ARC)”显卡品牌以来,英特尔发布了多个系列的显卡,并从多维度对锐炫进行升级。例如在去年年底,英特尔就带来了面向消费级客户的“锐炫B”系列,并同时推出了XeSS 2技术,为终端用户带来更好的体验。值得一提的是,在锐炫B系列上,还有一个被广泛认可硬件——AI引擎XMX。

在谈及这个产品设计背后的逻辑时,英特尔副总裁兼客户端显卡总经理Vivian Lien在日前开幕的Computex 2025上表示,设计一个能用于游戏和媒体相关工作的GPU本身就是非常复杂,但在看到AI成为重要工作负载之后,英特尔毅然为这系列GPU集成了AI引擎。“我们希望这系列GPU在能够满足打游戏的消费机需求之余,还能完成AI等专业级任务。”Vivian Lien总结说。

正是在这种思路指导下,英特尔锐炫Pro应运而生。Vivian Lien指出,锐炫Pro是随着锐炫第一代面世的,最初针对的是使用Graphics的专业人士。现在,英特尔希望将锐炫Pro带到Inference和Workstation的市场。于是,我们看到了英特尔在Computex 2025上带来的两款基于Xe2架构的锐炫 Pro新品B60和B50。

虽然在iGPU市场有了丰富的经验。但在独立显卡市场,英特尔可以称得上是新兵。
上次英特尔尝试打入显卡行业时,它发现自己开发的产品更适合处理繁重的计算工作负载。因此,英特尔将其作为至强融核 (Xeon Phi) 产品线发布,该产品线从 2010 年一直运营到 2020 年。
在当时,Xeon Phi 无疑是成功的,并被多个重大项目采用。但后来,英特尔取消 Xeon Phi 系列,转而使用英特尔 Arc 图形架构,通过英特尔 Arc Pro 系列在该领域展开竞争。这些年来,英特尔也一直致力于其 Arc GPU 平台的研发。目前,该公司为游戏玩家提供 B 系列芯片,以及面向工作站的 A 系列芯片,不过这些芯片更侧重于企业图形和视觉功能,而非 AI。
现在,随着集成更大内存和专为 AI 设计功能的Arc Pro B50 和 B60 的发布,英特尔进一步扩充了公司显卡的势力范围。
面向图形工作站的B50
据英特尔中国客户端计算产品事业部高级产品总监徐金平 (JP Xu)介绍,B50面向的主是主流的工作站工程设计应用,其配置特点主要是大显存,配备 16GB VRAM、16 个 Xe2 核心、128个XMX引擎,INT8 性能高达 170 TOPS。作为对比,锐炫 Pro A50的显存仅为6G。

“在性能方面,我们在英特尔锐炫 Pro产品线上有一个特点有专门的Pro Driver,和没有Driver的产品相比,仅仅从Driver层面,运行SpecView的性能提升幅度达到10%达到2.5倍。此外,PCIe Gen 5速度的提升也会带来10%-20%的性能提升。”徐金平 (JP Xu)接着说。

因为采用了半宽半高双槽位设计,英特尔将其称其为紧凑型显卡,虽然它采用了双插槽散热方案,但显卡本身的长度并不比它所插入的 PCIe x16 插槽长多少。它的功耗同样很低,不到 70 瓦,这意味着它不需要 PCIe 插槽提供的额外功率来运行。更重要的是,它的价格很实惠,仅为 299 美元。
在英特尔锐炫产品管理高级总监Qi Lin看来,正因为拥有如此高端的配置,在将锐炫 Pro B50推向零售市场后,是可以和消费级显卡进行竞争的。“即使在消费级显卡领域,也很难在这个价位段找到具备16GB显存和如此性能的产品。因此,我们认为这款产品无论是与消费级显卡竞争,还是与同类型的工作站显卡竞争,都具有显著的优势。”Qi Lin接着说。
值得一提的是,Arc Pro B50 系列还获得了领先内容创作应用程序的全面认证和验证。对于一款针对于消费机的显卡来说,这是无比重要的。

面向推理工作站B60
对于英特尔锐炫 Pro B60所专注的AI市场。众所周知,当前人工智能领域,随着模型规模持续扩张,对显存容量的需求也日益增长。“以7B参数规模的模型为例,若采用FP16进行推理,则至少需要16GB显存;而对于70B参数规模的模型,即使采用INT4量化,也需要超过30GB显存,若采用FP16,则显存需求将超过100GB。”徐金平 (JP Xu)举例说。
显而易见,大模型推理对显存容量提出了严峻挑战,这也是英特尔为锐炫 Pro B 60集成了24G显存的原因之一。

据英特尔介绍,这个大显存使 Arc Pro B60 在 AI 工作流程中比 Nvidia RTX 2000 Ada 和 Nvidia RTX 5060Ti 等配备 16 GB 内存的 GPU 具有显著的性能优势。作为一款定位为“推理工作站 GPU”的全尺寸产品,英特尔Arc Pro B 60总板载功率为 120W 至 200W。之所以拥有如此宽泛的功率范围,是因为该 GPU 将由包括但不限于华擎、蓝戟、Lanner、铭瑄、傲世、Senao和撼与科技等合作伙伴提供,涵盖各种型号和尺寸。

在英特尔发言人看来,推理工作站使中小型企业能够在本地运行和编纂其专有技术,并在本地使用其数据,从而避免与第三方服务共享。
针对市场对大显存容量的迫切需求,英特尔还设计了高效的多显卡互联方案,这也正是英特尔锐炫Pro B60专业显卡的一大亮点。据介绍,通过这种方式,开发者可以做到4张显卡甚至是8张显卡在一个工作站上。

为了实现这个目标,英特尔在底层做了一些软件的工作,具体而言就是做了GPUDirect Peer-to-Peer技术。其原理就是在GPU之间拷贝数据可以直接拷贝,不需要CPU参与进来,从而优化软件和整个系统。英特尔还用了一个叫张量并行算法的并行技术,把很大的大语言模型平均切分到4张或者是8张卡上进行推理,然后把结果合并输出给用户。
“以上都是我们通过软件来实现的。”徐金平强调。
推理工作站,大有可为
在英特尔看来,“推理工作站”系统具有巨大的市场潜力,因为它能满足不同的需求,(如图形设计工作站)。从其特性来看,推理工作站具有广阔的发展前景。徐金平表示,推理工作站的优势首先体现在其部署安全,数据无需上传至云端,可在本地进行处理;其次,推理工作站能提供一站式解决方案,将所有软件置于容器中,帮助客户解决问题,易于设置;第三,推理工作站可以灵活配置不同数量的显卡,易于扩展;最后,从成本效益方面来看,推理工作站具有显著优势。

有见及此,英特尔推出了一个命名为Battlematrix的项目。徐金平表示,这本质是一个推理工作站平台,基于PCIe 5.0的至强平台通信。根据英特尔的设想,该平台可在系统中提供多达 8 个英特尔 Arc Pro GPU,并支持高达 192 GB 的 VRAM。据英特尔称,这使其能够运行 70B+ 参数及以上的模型。

这里展示的是一个基于至强处理器的系统,配备多张显卡。我们的验证工作从单张显卡、两张开始,最高配置可达八张锐炫Pro B60显卡,提供高达192GB的显存,能够运行70B参数以上的模型。
而为了解决这个设计带来的软件部署复杂性问题,英特尔采用了一个容器化方案——在容器内部对大语言模型进行了包括Linux软件栈的支持、验证以及分阶段的软件发布等大量的优化。其整体软件栈如下图所示。

徐金平表示,之所以这样做,是因为在企业级解决方案中软件层级繁多。如果每一层都由客户自行开发,将这些软件组件整合在一起是一项非常复杂的工作。任何不匹配(例如版本不匹配、兼容性不匹配)都可能导致用户花费大量时间进行Debug,或者需要英特尔提供支持。
因此,英特尔将所有软件栈和版本进行匹配,并在容器内完成验证。这样,客户可以轻松地一键部署整个软件栈,并将精力集中在上层应用开发。
写在最后
英特尔总结说,这两款GPU针对AEC(建筑、工程、施工)和推理工作站进行了优化,并通过大量ISV认证和优化的软件提供稳定可靠的性能。英特尔锐炫Pro B系列GPU在Windows上兼容消费级和专业级驱动程序,在Linux上支持容器化的软件栈,该软件栈可以简化AI部署,并支持逐步升级和功能优化。通过将高显存容量与关键软件兼容性相结合,英特尔锐炫Pro B系列为创作者和AI开发者提供了可扩展的、经济高效的解决方案。
“专业人士在使用GPU时,要求有三点:产品必须要能够非常的坚固、非常的稳定以及相融性要非常好。而英特尔锐炫 Pro产品这三点都涵盖了。”Vivian Lien最后说。
责任编辑:Ace
相关文章
-
- 半导体行业观察
-
- 摩尔芯闻
最新新闻
热门文章 本日 七天 本月
- 1 [原创] 安森美的新目标
- 2 罗塞塔号撞向 67P 彗星,结束了人类历史上首次彗星探测任务
- 3 后摩尔时代光计算芯片成破局关键,国产厂商大有可为!
- 4 荣誉|鲲云科技获吴文俊人工智能科学技术奖芯片项目一等奖,颁奖盛典今日在京举行
- 5 重庆市委书记陈敏尔会见高通CEO