存储评论网

英特尔 Arc Pro B50 GPU 评测:一款价格实惠、低功耗的工作站 GPU

客户端配件  ◇  电子消费品

英特尔 Arc Pro B50 GPU 的发布标志着该公司在专业图形领域稳步扩张的又一重要里程碑。多年来,英特尔的 GPU 战略一直并行发展:面向消费者的游戏型 Arc 系列显卡,以及面向创作者、工程师和开发人员的工作站型 Arc Pro 系列产品。B 系列显卡延续了后者的发展方向,它汲取了 Arc Pro A 系列的经验,并在设计、驱动程序和软件方面进行了改进,旨在满足专业工作负载的需求,而非仅仅追求游戏基准测试。

英特尔 Arc Pro B50 GPU

Arc Pro B 系列目前包含两款型号:B50 和 B60,每款都旨在为 CAD、可视化、仿真和 AI 辅助工作流程提供可靠性、ISV 认证和可预测的性能。B50 是一款高效的入门级产品:它是一款紧凑型低功耗 GPU,专为小型系统和需要可靠加速但又不想承受高端显卡功耗或散热压力的专业人士而设计。B60 则在此基础上,拥有更多核心、更高的内存带宽和更大的显存,能够处理更大的数据集、更繁重的推理工作负载,或用于多 GPU 工作站,例如英特尔自家的 Battlematrix 参考平台。

尽管英伟达仍然是专业GPU市场的绝对领导者,AMD也凭借性价比优势持续保持竞争力,但英特尔推出Arc Pro B50的目的并非试图在一夜之间取代它们。相反,英特尔的目标是提供一个可靠的、基于标准的替代方案,该方案围绕能效、稳定的驱动程序以及通过其oneAPI生态系统实现的广泛应用兼容性而构建。此外,英特尔在GPU领域的不断积累的经验也间接地为B50带来了益处。 英特尔的 Gaudi 企业级人工智能加速器其中,内存效率和计算扩展性的架构改进为这一代的设计理念提供了依据。

值得注意的是,尽管名称相似,但Arc Pro B系列与英特尔Arc B系列游戏GPU截然不同。游戏系列面向追求性价比的发烧友和主流玩家,而Arc Pro B系列则更注重经过认证的稳定性、更长的生命周期支持以及专业级的驱动程序调校。简而言之,B50并非为游戏而生,而是为办公应用而打造。

对于从事设计可视化、AI推理和GPU加速计算等混合工作负载的创意专业人士、工程师和开发人员而言,英特尔Arc Pro B50显卡在效率、可靠性和成本之间实现了务实的平衡。其市场售价约为349美元,对于那些重视稳定性和专业集成而非追求极致性能的用户来说,这款显卡无疑是理想之选。

英特尔 Arc Pro B50 的设计与制造

从硬件本身来看,Arc Pro B50 采用紧凑型低功耗设计,适用于小型工作站和嵌入式平台,其尺寸为长 6.6 英寸、宽 2.7 英寸。它采用半高挡板,使其能够安装在空间有限的系统中,例如小型工作站或嵌入式环境。该显卡重 330 克,采用被动散热,依靠系统气流而非板载风扇。这种设计避免了额外的热负荷,但根据部署情况,可能需要规划机箱的通风布局。

英特尔 Arc Pro B50 GPU 背面

B50 通过 PCIe 插槽供电(70 瓦 TPD),无需任何外部连接器。这可以简化预装或 OEM 系统的集成,尤其是在布线或电源余量有限的情况下。英特尔建议使用此卡的系统至少配备 280 瓦电源。

Arc Pro B50 基于英特尔 Xe2 架构,采用台积电 5nm 工艺制造。它拥有 16 个 Xe 核心和 4 个渲染切片,GPU 上分布着 128 个用于通用计算的矢量引擎和 128 个用于 AI 工作负载的 XMX 引擎。此外,该架构还内置了 16 个专用光线追踪单元。显卡基础频率为 1700 MHz,必要时可睿频至 2600 MHz。其峰值计算性能为 10.65 TFLOPS(FP32)和 170 TOPS(INT8),后者通常用于 AI 推理。

它配备 16GB GDDR6 显存,采用 128 位总线。虽然这比高端 GPU 的显存位宽要窄一些,但它搭配了 14Gbps 的显存模块,总带宽可达 224 GB/s。对于许多专业任务,例如处理 3D 模型中的大型纹理、多层视频时间线或本地 AI 推理,这样的带宽足以保证大多数任务流畅运行。该显卡通过 PCIe 5.0 x8 接口连接(并兼容旧款 PCIe),为 Gen5 系统中的典型专业工作负载提供了充足的带宽。

Intel Arc Pro B50 GPU 端口

B50 显卡配备四个功能齐全的 DisplayPort 2.1 输出端口,可同时连接多达四台显示器。它支持高达 8K@60Hz 的分辨率,或支持多个 4K 显示器,且不会出现带宽问题。这些端口还支持 UHBR 13.5,这意味着高刷新率或高分辨率面板可以获得更高的数据速率,这对于提升显示清晰度和色彩深度尤为重要。在媒体方面,该显卡为包括 H.264、H.265、VP9 和 AV1 在内的标准编解码器提供完整的硬件加速,并支持 Dolby Vision 播放。在应用程序和框架方面,它涵盖了所有常用 API,包括 DirectX 12 Ultimate、Vulkan 1.4、OpenGL 4.6 和 OpenCL 3.0。该显卡支持 Intel 的 oneAPI、OpenVINO、XeSS 和 PyTorch IPEX 扩展,所有这些技术都旨在提升 AI 和机器学习工作负载的性能。

英特尔 Arc Pro B50 技术规格

规格 Detail
GPU架构 Xe2(台积电 N5)
xe-颜色 16
渲染切片 4
光线追踪单元 16
XMX发动机 128
矢量引擎 128
图形基频 1700 MHz
最大动态时钟 2600 MHz
GPU FP32 性能 10.65 TFLOPS
GPU峰值TOPS(INT8) 170
主板总功耗 (TBP) 70W 瓦
内存 16 GB GDDR6
存储器接口 128 bit
内存带宽 224 GB /秒
记忆体速度 14 Gbps
PCIe 接口 PCIe 5.0 x8
显示输出 4 个 DisplayPort 2.1 (UHBR 13.5)
最高分辨率 7680 x 4320 @ 60Hz
支持 H.264 / H.265 / AV1 / VP9
API支持 DirectX 12 Ultimate、Vulkan 1.4、OpenGL 4.6、OpenCL 3.0
oneAPI / OpenVINO 支持
PyTorch IPEX 扩展
Intel XeSS 支持
外形 6.6 英寸 x 2.7 英寸,双槽
重量 330克
电源连接器 无(通过 PCIe 插槽供电)
最低电源供应量 280W 瓦
保修政策 3 年
发布日期 第3季度 2025 年

英特尔 Arc Pro B50 性能

性能测试重点考察 Arc Pro B50 如何处理 AI 推理、图像生成、渲染和计算密集型应用程序等实际工作负载。

UL Procyon:AI 文本生成

Procyon AI 文本生成基准 它通过提供简洁一致的评估方法,简化了 AI LLM 性能测试。它允许对多个 LLM 模型进行重复测试,同时最大限度地降低大型模型和可变因素的复杂性。该方案与 AI 硬件领域的领先企业合作开发,优化了本地 AI 加速器的使用,从而提供更可靠、更高效的性能评估。以下结果是使用 NVIDIA 模型上的 TensorRT 和 AMD 模型上的 ONNX 测得的。

Arc Pro B50 在其同类产品中表现出色,排名高于 AMD 的 RX 9060 XT 和 9070,并且在综合得分上与 RTX 5060 Ti 不相上下。它最大的优势在于响应时间,在所有型号中,它的首次令牌响应时间始终最快。令牌吞吐量低于 NVIDIA 的新款显卡。然而,对于诸如轻量级推理或具有 AI 功能的设计工具等任务,B50 对于那些没有高端硬件的用户来说是一个不错的选择。

UL Procyon:AI 文本生成 英特尔 Arc Pro B50 AMD Radeon RX 9060 XT 的AMD Radeon RX 9070 AMD Radeon RX 9070 XT NVIDIA GeForce RTX 5060 Ti NVIDIA GeForce RTX 5070FE
菲总分 2,593 1,281 1,933 2,080 2,870 3,453
Phi 输出时间到第一个标记 0.275小号 1.473小号 0.954小号 0.855小号 0.375小号 0.323小号
每秒输出 Phi 令牌数 72.128 个代币/秒 94.453 个代币/秒 139.187 个代币/秒 144.471 个代币/秒 120.773 个代币/秒 150.435 个代币/秒
Phi 总时长 39.179小号 39.365小号 26.989小号 25.587小号 25.216小号 20.302小号
米斯特拉尔总成绩 2,483 1,274 2,040 2,231 2,807 3,562
Mistral 输出第一个令牌的时间 0.346小号 1.827小号 1.109小号 0.946小号 0.526小号 0.433小号
每秒 Mistral 输出代币数 46.799 个代币/秒 65.115 个代币/秒 101.300 个代币/秒 103.348 个代币/秒 91.057 个代币/秒 120.507 个代币/秒
米斯特拉尔总持续时间 59.907小号 54.516小号 34.960小号 33.350小号 33.377小号 25.496小号
Llama3 总体评分 2,427 1,150 1,904 2,070 2,599 3,125
Llama3 输出第一个标记的时间 0.311小号 1.632小号 0.981小号 0.845小号 0.449小号 0.379小号
Llama3 每秒输出令牌数 145.031 个代币/秒 53.167 个代币/秒 87.594 个代币/秒 89.102 个代币/秒 74.709 个代币/秒 100.388 个代币/秒
Llama3 总时长 61.926 2 62.563小号 38.273小号 36.742小号 39.489小号 29.720小号
Llama2 总体评分 1,252 2,047 2,298 2,576 3,125
Llama2 输出第一个标记的时间 2.992小号 1.926小号 1.565小号 0.844小号 0.785小号
Llama2 每秒输出令牌数 34.654 个代币/秒 59.673 个代币/秒 61.127 个代币/秒 41.386 个代币/秒 56.647 个代币/秒
Llama2 总时长 99.027小号 59.100小号 55.520小号 71.302小号 53.234小号

UL Procyon: 人工智能图像生成

Procyon AI 图像生成基准 该基准测试能够持续、准确地衡量各种硬件(从低功耗NPU到高端GPU)的AI推理性能。它包含三项测试:针对高端GPU的Stable Diffusion XL (FP16)测试、针对中等性能GPU的Stable Diffusion 1.5 (FP16)测试以及针对低功耗设备的Stable Diffusion 1.5 (INT8)测试。该基准测试会针对每个系统使用最佳推理引擎,从而确保结果的公平性和可比性。

图像生成性能体现了B50的局限性。尽管如此,它顺利完成了所有测试,INT8测试结果表明,必要时它可以处理优化的推理模型。它并不适合频繁的图像生成,但对于轻量级或偶尔进行的AI图形任务来说,它还是可以胜任的。

UL Procyon:AI 图像生成(总分:越高越好) 英特尔 Arc Pro B50 AMD Radeon RX 9070 XT NVIDIA GeForce RTX 5060 Ti 的AMD Radeon RX 9070 AMD Radeon RX 9070 XT NVIDIA GeForce RTX 5070FE
稳定扩散 1.5 (FP16) — 总体得分 754 1,436 2,110 2,280 2,598 2,937
稳定扩散 1.5 (FP16) — 总时间 132.585小号 69.633小号 47.590小号 43.858小号 38.481小号 34.038小号
稳定扩散 1.5 (FP16) — 图像生成速度 8.287 秒/图像 4.352 秒/图像 2.974 秒/图像 2.741 秒/图像 2.405 秒/图像 2.127 秒/图像
稳定扩散 1.5 (INT8) — 总体得分 5,020 27,705 36,320
稳定扩散 1.5 (INT8) — 总时间 49.795小号 9.024小号 6.883小号
稳定扩散 1.5 (INT8) — 图像生成速度 6.224 秒/图像 1.128 秒/图像 0.860 秒/图像
稳定扩散 XL (FP16) — 总体得分 748 1,124 1,940 1,805 2,010 2,473
稳定扩散 XL (FP16) — 总时间 790.774小号 533.736小号 326.550小号 332.400小号 298.499小号 242.606小号
稳定扩散 XL (FP16) — 图像生成速度 49.423 秒/图像 33.359 秒/图像 20.409 秒/图像 20.775 秒/图像 18.656 秒/图像 15.163 秒/图像

乐士马克

Luxmark 是一款 GPU 基准测试软件,它使用开源光线追踪渲染器 LuxRender 来评估系统在处理高精度 3D 场景时的性能。该基准测试软件尤其适用于评估服务器和工作站的图形渲染能力,尤其是在视觉特效和建筑可视化应用中,因为在这些应用中,精确的光照模拟至关重要。

在 LuxMark 测试中,B50 的成绩远低于 5060 Ti 或 RX 9070 等中端 GPU,这并不意外。它能够完成光线追踪工作负载,但渲染速度有限。

Luxmark(越高越好) 英特尔 Arc Pro B50 AMD Radeon RX 9060 XT NVIDIA GeForce RTX 5060 Ti 的AMD Radeon RX 9070 AMD Radeon RX 9070 XT NVIDIA GeForce RTX 5070FE
食物评分 2,456 4,220 6,590 8,233 8,610 9,061
霍尔斯 5,158 8,007 15,348 16,566 16,758 22,062

Geekbench 6

Geekbench 6 是衡量整体系统性能的跨平台基准测试。Geekbench 浏览器可让您将任何系统与其进行比较。

这款GPU的跑分略高于70,000万分,符合低功耗、小巧GPU的预期表现。它并非为繁重的计算任务或仿真工作而设计,但对于CAD和专业应用程序中的基本GPU加速来说,其性能尚可。

Geekbench(越高越好) 英特尔 Arc Pro B50 AMD Radeon RX 9060 XT 的AMD Radeon RX 9070 NVIDIA GeForce RTX 5060 Ti NVIDIA GeForce RTX 5070FE AMD Radeon RX 9070 XT
GPU OpenCL 分数 70,038 102,750 138,463 150,743 173,255 188,892

3DMark

3DMark Port Royal、Speed Way 和 Steel Nomad 是三款 GPU 基准测试软件,用于测试 GPU 在不同场景下的性能。Port Royal 侧重于光线追踪,Speed Way 评估 GPU 在赛车模拟中的性能,而 Steel Nomad 则以高强度、逼真的图形挑战 GPU 的性能。它们评估 GPU 在渲染、光照和动态场景方面的能力。

3DMark 测试结果远低于入门级游戏显卡。但这也在意料之中。这与其在工作站领域的定位相符,在工作站中,稳定性和能效比帧率或实时渲染更为重要。

3DMark(分数越高越好) 英特尔 Arc Pro B50 AMD Radeon RX 9060 XT NVIDIA GeForce RTX 5060 Ti NVIDIA GeForce RTX 5070FE 的AMD Radeon RX 9070 AMD Radeon RX 9070 XT
皇家港口 4,197 9,751 10,432 14,026 15,760 17,989
速度方式 1,355 3,004 4,184 5,869 5,791 6,237
钢铁游牧者 1,644 3,767 3,611 5,019 5,992 6,977

黄玉视频 AI

Topaz Video AI 是一款专业的应用程序,利用先进的 AI 模型增强和恢复视频。它支持多种任务,包括将素材升级到 4K 或 8K、锐化模糊内容、降低噪点、增强面部细节、为黑白素材着色以及插入帧以增强运动效果。该套件包含一个板载基准测试,可衡量系统在不同视频增强算法下的性能,从而清晰地了解硬件平台处理高要求 AI 视频处理工作负载的能力。

在 Topaz 中,Intel Arc Pro B50 的性能表现一般,符合低功耗、插槽式工作站 GPU 的预期。

在 Artemis 模型中,1 倍放大时帧率为 10.50 fps,4 倍放大时降至 2.47 fps,表明虽然它可以处理基本的图像增强或降噪任务,但更复杂的图像放大操作会迅速耗尽 GPU 的性能。Iris 和 Proteus 模型的表现类似,1 倍放大时帧率约为 8-10 fps,4 倍放大时低于 3 fps,反映出该显卡在处理 AI 驱动型工作负载时计算能力有限。

像 Nyx、Rhea 和 RXL 这样对 GPU 要求更高的特效流程,帧率都低于 2 fps,这证实了 Arc Pro B50 并非为大规模时间或多帧处理而设计。而像 Apollo 和 Aion 这样对 GPU 要求较低的特效流程,帧率分别达到了 8.49 fps 和 25.12 fps,表明在特效对 GPU 要求不高的情况下,它们的效率更高。

总体而言,Arc Pro B50 能够胜任一些轻量的 1080p 视频增强任务,但对于高强度的视频升频或 AI 辅助修复来说性能不足。它更适合偶尔预览或少量批量处理,而非繁重的制作用途。

Geekbench的

Geekbench 6 是一个跨平台基准测试,用于衡量整体系统性能。

Intel Arc Pro B50 在 Blender 的测试场景中表现平平,这与预期相符,毕竟它的所有功率都直接来自 PCIe 总线。

在 Monster 场景中,该显卡达到了每分钟 738.16 个采样,这是一个不错的数值,表明它无需外部电源即可处理中等复杂度的几何和着色工作负载。不过,其性能仍然低于高功耗工作站 GPU 的预期水平。

在“废品站”场景中,测试结果更具挑战性,Arc Pro B50 的采样率为每分钟 405.23 次。该测试主要考察纹理密度和光线追踪性能,结果表明该显卡低功耗设计存在固有的带宽和计算能力限制。

在教室场景中,GPU 每分钟产生 414.62 个样本,保持了稳定的渲染性能,但再次逊色于更强大的、主动供电的选项。

搅拌机性能测试(每分钟采样次数,越高越好) 搅拌机4.3.0 搅拌机4.4.0 搅拌机4.5.0
怪物 632.94 650.88 738.16
旧货店 293.15 344.19 405.23
课堂 329.82 358.63 414.62

功耗:英特尔 B50

功耗是任何高端或低端计算平台的重要组成部分。每一代新的GPU在负载下都会消耗更多电量,这意味着需要更大的电源和充足的散热气流。然而,功耗与性能之间还有另一个关系:更快的GPU虽然峰值功耗可能更高,但每次负载的持续时间会缩短。利用…… Quarch 电源分析仪 在我们的测试实验室中,我们测量了运行 Procyon AI 图像生成器 稳定 Diffusion XL FP16 测试。此工作负载将每个 GPU 推至其功率极限,并且每个生成图像的明确起点和终点清晰可见。

在本次测试中,Intel Arc Pro B50 的功耗最低,仅为 70W。在 Procyon AI 图像生成测试运行时,系统功耗从 151W 的后台功耗上升至平均负载功耗 384W。我们测得系统的峰值功耗为 586W。生成倒数第二张图像耗时 49.9 秒,期间耗电 5.32Wh。虽然 Intel Arc Pro B50 的设计理念是尽可能降低 PCIe 插槽本身的功耗,但在本次测试中,生成一张图像所需的总功耗仍然较高。

稳定扩散 XL FP16 图像功率使用情况(越低越好) 英特尔 Arc Pro B50 的AMD Radeon RX 9070 AMD 的Radeon RX 9070 XT PNY NVIDIA GeForce RTX 5060钛 NVIDIA公司 的GeForce RTX 5070 FE
耗电量 5.32瓦 4瓦 3.41Wh 2.13瓦 2.46Wh
测试时间 49.9小号 33秒 17.4小号 20.2小号 19.2小号

结语

Arc Pro B50 的目标并非成为专业 GPU 市场中最快的显卡。相反,它以紧凑、节能的外形尺寸,提供可靠的性能、稳定的驱动程序和广泛的应用支持。在我们的测试中,它能够轻松应对所有工作负载,没有出现任何不稳定或过热问题。其小巧的尺寸使其能够轻松适配现有工作站,而这些工作站无法容纳更大或更高功耗的 GPU。

对于从事 CAD、设计可视化或 AI 辅助应用的专业人士而言,如果他们更注重性能的稳定性和兼容性而非最大吞吐量,那么 B50 是一款实用且经济的选择。其售价约为 349 美元,对于小型机箱、OEM 集成以及部署多个工作站节点的实验室来说,极具性价比。如果您优先考虑的是安静、可靠且能无缝集成到专业工作流程中的加速性能,那么 Arc Pro B50 无疑是明智之选。

英特尔产品页面

参与 StorageReview

资讯订阅 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter(现为X) | TikTok | RSS订阅

布赖恩·比勒

Brian 位于俄亥俄州辛辛那提市,是 StorageReview.com 的首席分析师兼总裁。