存儲評論網

英特爾 Arc Pro B50 GPU 評測:一款價格實惠、低功耗的工作站 GPU

客戶端配件  ◇  消費者

英特爾 Arc Pro B50 GPU 的發布標誌著該公司在專業圖形領域穩步擴張的另一個重要里程碑。多年來,英特爾的 GPU 策略一直沿著兩條平行路線發展:面向消費者的遊戲型 Arc 顯示卡,以及創作者、工程師和開發人員的工作站型 Arc Pro 產品。 B 系列顯示卡延續了後者的發展方向,它汲取了 Arc Pro A 系列的經驗,並在設計、驅動程式和軟體方面進行了改進,旨在滿足專業工作負載的需求,而不是僅僅追求遊戲基準測試。

英特爾 Arc Pro B50 GPU

Arc Pro B 系列目前包含兩款型號:B50 和 B60,每款車型都旨在為 CAD、視覺化、模擬和 AI 輔助工作流程提供可靠性、ISV 認證和可預測的效能。 B50 是一款高效的入門級產品:它是一款緊湊型低功耗 GPU,專為小型系統和需要可靠加速但又不想承受高端顯示卡功耗或散熱壓力的專業人士而設計。 B60 則在此基礎上,擁有更多核心、更高的記憶體頻寬和更大的顯存,能夠處理更大的資料集、更繁重的推理工作負載,或用於多 GPU 工作站,例如英特爾自家的 Battlematrix 參考平台。

儘管英偉達仍然是專業GPU市場的絕對領導者,AMD也憑藉性價比優勢持續保持競爭力,但英特爾推出Arc Pro B50的目的並非試圖在一夜之間取代它們。相反,英特爾的目標是提供一個可靠的、基於標準的替代方案,該方案圍繞著能源效率、穩定的驅動程式以及透過其oneAPI生態系統實現的廣泛應用相容性而構建。此外,英特爾在GPU領域的不斷累積的經驗也間接地為B50帶來了好處。 英特爾的 Gaudi 企業級人工智慧加速器其中,記憶體效率和運算擴展性的架構改進為這一代的設計理念提供了基礎。

值得注意的是,儘管名稱相似,但Arc Pro B系列與英特爾Arc B系列遊戲GPU截然不同。遊戲系列針對追求性價比的發燒友和主流玩家,而Arc Pro B系列則更注重經過認證的穩定性、更長的生命週期支援以及專業級的驅動程式調校。簡而言之,B50並非為遊戲而生,而是為辦公室應用而打造。

對於從事設計視覺化、AI推理和GPU加速運算等混合工作負載的創意專業人士、工程師和開發人員而言,英特爾Arc Pro B50顯示卡在效率、可靠性和成本之間實現了務實的平衡。其市場售價約為349美元,對於那些重視穩定性和專業整合而非追求極致效能的用戶來說,這款顯示卡無疑是理想之選。

英特爾 Arc Pro B50 的設計與製造

從硬體本身來看,Arc Pro B50 採用緊湊型低功耗設計,適用於小型工作站和嵌入式平台,其尺寸為長 6.6 吋、寬 2.7 吋。它採用半高擋板,使其能夠安裝在空間有限的系統中,例如小型工作站或嵌入式環境。此顯示卡重 330 克,採用被動散熱,依靠系統氣流而非板載風扇。這種設計避免了額外的熱負荷,但根據部署情況,可能需要規劃機箱的通風佈局。

英特爾 Arc Pro B50 GPU 背面

B50 透過 PCIe 插槽供電(70 瓦 TPD),無需任何外部連接器。這可以簡化預裝或 OEM 系統的集成,尤其是在佈線或電源餘裕有限的情況下。英特爾建議使用此卡的系統至少配備 280 瓦電源。

Arc Pro B50 基於英特爾 Xe2 架構,採用台積電 5nm 製程製造。它擁有 16 個 Xe 核心和 4 個渲染切片,GPU 上分佈著 128 個用於通用運算的向量引擎和 128 個用於 AI 工作負載的 XMX 引擎。此外,該架構還內建了 16 個專用光線追蹤單元。顯示卡基礎頻率為 1700 MHz,必要時可睿頻至 2600 MHz。其峰值計算性能為 10.65 TFLOPS(FP32)和 170 TOPS(INT8),後者通常用於 AI 推理。

它配備 16GB GDDR6 記憶體,採用 128 位元匯流排。雖然這比高階 GPU 的顯存位寬要窄一些,但它搭配了 14Gbps 的顯存模組,總頻寬可達 224 GB/s。對於許多專業任務,例如處理 3D 模型中的大型紋理、多層視訊時間軸或本地 AI 推理,這樣的頻寬足以確保大多數任務流暢運行。此顯示卡透過 PCIe 5.0 x8 介面連接(並相容於舊款 PCIe),為 Gen5 系統中的典型專業工作負載提供了充足的頻寬。

Intel Arc Pro B50 GPU 端口

B50 顯示卡配備四個功能齊全的 DisplayPort 2.1 輸出端口,可同時連接多達四台顯示器。它支援高達 8K@60Hz 的分辨率,或支援多個 4K 顯示器,且不會出現頻寬問題。這些連接埠還支援 UHBR 13.5,這意味著高刷新率或高解析度面板可以獲得更高的資料速率,這對於提升顯示清晰度和色彩深度尤其重要。在媒體方面,此顯示卡為包括 H.264、H.265、VP9 和 AV1 在內的標準編解碼器提供完整的硬體加速,並支援 Dolby Vision 播放。在應用程式和框架方面,它涵蓋了所有常用 API,包括 DirectX 12 Ultimate、Vulkan 1.4、OpenGL 4.6 和 OpenCL 3.0。此顯示卡支援 Intel 的 oneAPI、OpenVINO、XeSS 和 PyTorch IPEX 擴展,所有這些技術都旨在提升 AI 和機器學習工作負載的效能。

英特爾 Arc Pro B50 技術規格

規格 詳情
GPU架構 Xe2(台積電 N5)
Xe-顏色 16
渲染切片 4
光線追踪單元 16
XMX發動機 128
向量引擎 128
圖形基頻 1700 MHz
最大動態時鐘 2600 MHz
GPU FP32 效能 10.65 TFLOPS
GPU峰值TOPS(INT8) 170
主板總功耗 (TBP) 70W¯¯
記憶體應用 16 GB GDDR6
存儲器接口 128-位
內存帶寬 224 GB / s
記憶體速度 14 Gbps
PCIe 接口 PCIe 5.0 x8
顯示輸出 4 個 DisplayPort 2.1 (UHBR 13.5)
最大分辨率 7680 x 4320 @ 60Hz
支持 H.264 / H.265 / AV1 / VP9 可以
API支持 DirectX 12 Ultimate、Vulkan 1.4、OpenGL 4.6、OpenCL 3.0
oneAPI / OpenVINO 支持 可以
PyTorch IPEX 擴展 可以
Intel XeSS 支援 可以
外形 6.6 英寸 x 2.7 英寸,雙槽
重量 330 克
電源連接器 無(透過 PCIe 插槽供電)
最低電源供應量 280W¯¯
保修政策 3年
發射日期 Q3 2025

英特爾 Arc Pro B50 效能

效能測試重點在於檢視 Arc Pro B50 如何處理 AI 推理、影像生成、渲染和計算密集型應用程式等實際工作負載。

UL Procyon:人工智慧文字生成

Procyon AI 文字產生基準 它透過提供簡潔一致的評估方法,簡化了 AI LLM 性能測試。它允許對多個 LLM 模型進行重複測試,同時最大限度地降低大型模型和可變因素的複雜性。該方案與 AI 硬體領域的領導企業合作開發,優化了本地 AI 加速器的使用,從而提供更可靠、更有效率的效能評估。以下結果是使用 NVIDIA 模型上的 TensorRT 和 AMD 模型上的 ONNX 測得的。

Arc Pro B50 在其同類產品中表現出色,排名高於 AMD 的 RX 9060 XT 和 9070,並且在綜合得分上與 RTX 5060 Ti 不相上下。它最大的優勢在於響應時間,在所有型號中,它的首次令牌響應時間始終最快。令牌吞吐量低於 NVIDIA 的新顯示卡。然而,對於諸如輕量級推理或具有 AI 功能的設計工具等任務,B50 對於那些沒有高端硬體的用戶來說是一個不錯的選擇。

UL Procyon:人工智慧文字生成 英特爾 Arc Pro B50 AMD Radeon RX 9060 XT 的AMD Radeon RX 9070 AMD Radeon RX 9070 XT NVIDIA GeForce RTX 5060 Ti NVIDIA GeForce RTX 5070 FE
Phi 總分 2,593 1,281 1,933 2,080 2,870 3,453
Phi 輸出到第一個代幣的時間 0.275小號 1.473小號 0.954小號 0.855小號 0.375小號 0.323小號
Phi 每秒輸出令牌 72.128 令牌/秒 94.453 令牌/秒 139.187 令牌/秒 144.471 令牌/秒 120.773 令牌/秒 150.435 令牌/秒
Phi 總持續時間 39.179小號 39.365小號 26.989小號 25.587小號 25.216小號 20.302小號
米斯特拉爾總分 2,483 1,274 2,040 2,231 2,807 3,562
米斯特拉爾輸出第一個令牌的時間 0.346小號 1.827小號 1.109小號 0.946小號 0.526小號 0.433小號
米斯特拉爾每秒輸出令牌 46.799 令牌/秒 65.115 令牌/秒 101.300 令牌/秒 103.348 令牌/秒 91.057 令牌/秒 120.507 令牌/秒
米斯特拉爾總持續時間 59.907小號 54.516小號 34.960小號 33.350小號 33.377小號 25.496小號
Llama3 總分 2,427 1,150 1,904 2,070 2,599 3,125
Llama3 輸出第一個令牌的時間 0.311小號 1.632小號 0.981小號 0.845小號 0.449小號 0.379小號
Llama3 每秒輸出令牌 145.031 令牌/秒 53.167 令牌/秒 87.594 令牌/秒 89.102 令牌/秒 74.709 令牌/秒 100.388 令牌/秒
Llama3 整體持續時間 61.926 2 62.563小號 38.273小號 36.742小號 39.489小號 29.720小號
Llama2 總分 - 1,252 2,047 2,298 2,576 3,125
Llama2 輸出第一個令牌的時間 - 2.992小號 1.926小號 1.565小號 0.844小號 0.785小號
Llama2 每秒輸出令牌 - 34.654 令牌/秒 59.673 令牌/秒 61.127 令牌/秒 41.386 令牌/秒 56.647 令牌/秒
Llama2 整體持續時間 - 99.027小號 59.100小號 55.520小號 71.302小號 53.234小號

UL Procyon: 人工智能圖像生成

Procyon AI 影像產生基準 此基準測試能夠持續、精確地衡量各種硬體(從低功耗NPU到高階GPU)的AI推理效能。它包含三項測試:針對高階GPU的Stable Diffusion XL (FP16)測試、針對中型效能GPU的Stable Diffusion 1.5 (FP16)測試以及針對低功耗裝置的Stable Diffusion 1.5 (INT8)測試。此基準測試會針對每個系統使用最佳推理引擎,確保結果的公平性和可比較性。

影像生成性能體現了B50的限制。儘管如此,它順利完成了所有測試,INT8測試結果表明,必要時它可以處理優化的推理模型。它並不適合頻繁的影像生成,但對於輕量級或偶爾進行的AI圖形任務來說,它還是可以勝任的。

UL Procyon:AI 影像產生(總分:越高越好) 英特爾 Arc Pro B50 AMD Radeon RX 9070 XT NVIDIA GeForce RTX 5060 Ti 的AMD Radeon RX 9070 AMD Radeon RX 9070 XT NVIDIA GeForce RTX 5070 FE
穩定擴散 1.5 (FP16) — 總體得分 754 1,436 2,110 2,280 2,598 2,937
穩定擴散 1.5 (FP16) — 總時間 132.585小號 69.633小號 47.590小號 43.858小號 38.481小號 34.038小號
穩定擴散 1.5 (FP16) — 影像產生速度 8.287 秒/影像 4.352 秒/影像 2.974 秒/影像 2.741 秒/影像 2.405 秒/影像 2.127 秒/影像
穩定擴散 1.5 (INT8) — 總體得分 5,020 不適用 27,705 不適用 不適用 36,320
穩定擴散 1.5 (INT8) — 總時間 49.795小號 不適用 9.024小號 不適用 不適用 6.883小號
穩定擴散 1.5 (INT8) — 影像生成速度 6.224 秒/影像 不適用 1.128 秒/影像 不適用 不適用 0.860 秒/影像
穩定擴散 XL (FP16) — 總體得分 748 1,124 1,940 1,805 2,010 2,473
穩定擴散 XL (FP16) — 總時間 790.774小號 533.736小號 326.550小號 332.400小號 298.499小號 242.606小號
穩定擴散 XL (FP16) — 影像產生速度 49.423 秒/影像 33.359 秒/影像 20.409 秒/影像 20.775 秒/影像 18.656 秒/影像 15.163 秒/影像

樂士馬克

Luxmark 是一款 GPU 基準測試軟體,它使用開源光線追蹤渲染器 LuxRender 來評估系統在處理高精度 3D 場景時的效能。此基準測試軟體尤其適用於評估伺服器和工作站的圖形渲染能力,尤其是在視覺特效和建築視覺化應用中,因為在這些應用中,精確的光照模擬至關重要。

在 LuxMark 測驗中,B50 的成績遠低於 5060 Ti 或 RX 9070 等中階 GPU,這並不令人意外。它能夠完成光線追蹤工作負載,但渲染速度有限。

Luxmark(越高越好) 英特爾 Arc Pro B50 AMD Radeon RX 9060 XT NVIDIA GeForce RTX 5060 Ti 的AMD Radeon RX 9070 AMD Radeon RX 9070 XT NVIDIA GeForce RTX 5070 FE
食物評分 2,456 4,220 6,590 8,233 8,610 9,061
霍爾分數 5,158 8,007 15,348 16,566 16,758 22,062

Geekbench 6

Geekbench 6 是衡量整體系統效能的跨平台基準測試。 Geekbench 瀏覽器可讓您將任何系統與其進行比較。

這款GPU的跑分略高於70,000萬分,符合低功耗、小巧GPU的預期表現。它並非為繁重的運算任務或模擬工作而設計,但對於CAD和專業應用程式中的基本GPU加速來說,其效能尚可。

Geekbench(越高越好) 英特爾 Arc Pro B50 AMD Radeon RX 9060 XT 的AMD Radeon RX 9070 NVIDIA GeForce RTX 5060 Ti NVIDIA GeForce RTX 5070 FE AMD Radeon RX 9070 XT
GPU OpenCL 分數 70,038 102,750 138,463 150,743 173,255 188,892

3DMark

3DMark Port Royal、Speed Way 和 Steel Nomad 是三款 GPU 基準測試軟體,用於測試 GPU 在不同場景下的效能。 Port Royal 專注於光線追踪,Speed Way 評估 GPU 在賽車模擬中的性能,而 Steel Nomad 則以高強度、逼真的圖形挑戰 GPU 的性能。它們評估 GPU 在渲染、光照和動態場景方面的能力。

3DMark 測試結果遠低於入門遊戲顯示卡。但這也在意料之中。這與其在工作站領域的定位相符,在工作站中,穩定性和能效比幀率或即時渲染更為重要。

3DMark(分數越高越好) 英特爾 Arc Pro B50 AMD Radeon RX 9060 XT NVIDIA GeForce RTX 5060 Ti NVIDIA GeForce RTX 5070 FE 的AMD Radeon RX 9070 AMD Radeon RX 9070 XT
皇家港口 4,197 9,751 10,432 14,026 15,760 17,989
速度之路 1,355 3,004 4,184 5,869 5,791 6,237
鋼鐵游牧者 1,644 3,767 3,611 5,019 5,992 6,977

黃玉視頻 AI

Topaz Video AI 是一款專業的應用程序,可利用先進的 AI 模型增強和恢復影片。它支援多種任務,包括將素材升級到 4K 或 8K、銳利化模糊內容、降低雜訊、增強臉部細節、為黑白素材著色以及插入畫面以增強運動效果。該套件包含一個板載基準測試,可衡量系統在不同視訊增強演算法下的效能,從而清晰地了解硬體平台處理高要求 AI 視訊處理工作負載的能力。

在 Topaz 中,Intel Arc Pro B50 的效能表現一般,符合低功耗、插槽式工作站 GPU 的預期。

在 Artemis 模型中,1 倍放大時幀率為 10.50 fps,4 倍放大時降至 2.47 fps,表明雖然它可以處理基本的影像增強或降噪任務,但更複雜的影像放大操作會迅速耗盡 GPU 的效能。 Iris 和 Proteus 模型的表現類似,1 倍放大時幀率約為 8-10 fps,4 倍放大時低於 3 fps,反映出該顯示卡在處理 AI 驅動型工作負載時計算能力有限。

像 Nyx、Rhea 和 RXL 這樣對 GPU 要求更高的特效流程,幀率都低於 2 fps,這證實了 Arc Pro B50 並非為大規模時間或多幀處理而設計。而像 Apollo 和 Aion 這樣對 GPU 要求較低的特效流程,幀率分別達到了 8.49 fps 和 25.12 fps,顯示在特效對 GPU 要求不高的情況下,它們的效率更高。

總體而言,Arc Pro B50 能夠勝任一些輕量的 1080p 視訊增強任務,但對於高強度的視訊升頻或 AI 輔助修復來說表現不足。它更適合偶爾預覽或少量批量處理,而非繁重的製作用途。

GeekBench

Geekbench 6 是一個跨平台基準測試,用於衡量整體系統效能。

Intel Arc Pro B50 在 Blender 的測試場景中表現平平,這與預期相符,畢竟它的所有功率都直接來自 PCIe 總線。

在 Monster 場景中,該顯示卡達到了每分鐘 738.16 個取樣,這是一個不錯的數值,表明它無需外部電源即可處理中等複雜度的幾何和著色工作負載。不過,其效能仍低於高功耗工作站 GPU 的預期水準。

在「廢品站」場景中,測試結果更具挑戰性,Arc Pro B50 的取樣率為每分鐘 405.23 次。此測試主要檢視紋理密度和光線追蹤效能,結果顯示此顯示卡低功耗設計存在固有的頻寬和運算能力限制。

在教室場景中,GPU 每分鐘產生 414.62 個樣本,保持了穩定的渲染性能,但再次遜色於更強大的、主動供電的選項。

攪拌機性能測試(每分鐘採樣次數,越高越好) 攪拌機4.3.0 攪拌機4.4.0 攪拌機4.5.0
Monster 632.94 650.88 738.16
舊貨店 293.15 344.19 405.23
課堂 329.82 358.63 414.62

耗電量:Intel B50

功耗是任何高端或低端運算平台的重要組成部分。每一代新的GPU在負載下都會消耗更多電量,這意味著需要更大的電源和充足的散熱氣流。然而,功耗與效能之間還有另一個關係:更快的GPU雖然尖峰功耗可能更高,但每次負載的持續時間會縮短。利用… Quarch 電源分析儀 在我們的測試實驗室中,我們測量了運行時的系統總功耗 Procyon AI 影像產生器 穩定擴散 XL FP16 測試。這種工作負載將每個 GPU 推向了其功率極限,並為每個生成的影像定義了清晰的起始點和停止點。

在本次測試中,Intel Arc Pro B50 的功耗最低,僅 70W。在 Procyon AI 影像產生測試運行時,系統功耗從 151W 的後台功耗上升至平均負載功耗 384W。我們測得係統的峰值功耗為 586W。產生倒數第二張影像耗時 49.9 秒,期間耗電 5.32Wh。雖然 Intel Arc Pro B50 的設計理念是盡可能降低 PCIe 插槽本身的功耗,但在本次測試中,產生一張影像所需的總功耗仍然較高。

穩定擴散 XL FP16 影像功率使用情況(越低越好) 英特爾 Arc Pro B50 的AMD Radeon RX 9070 AMD RADEON RX 9070 XT PNY NVIDIA GeForce RTX 5060鈦 NVIDIA 的GeForce RTX 5070 鐵
耗電量 5.32瓦 4瓦 3.41Wh 2.13瓦 2.46Wh
測試時間 49.9小號 33秒 17.4小號 20.2小號 19.2小號

結語

Arc Pro B50 的目標並非成為專業 GPU 市場中最快的顯示卡。相反,它以緊湊、節能的外形尺寸,提供可靠的性能、穩定的驅動程式和廣泛的應用支援。在我們的測試中,它能夠輕鬆應對所有工作負載,沒有任何不穩定或過熱問題。其小巧的尺寸使其能夠輕鬆適應現有工作站,而這些工作站無法容納更大或更高功耗的 GPU。

對於從事 CAD、設計視覺化或 AI 輔助應用的專業人士而言,如果他們更注重效能的穩定性和相容性而非最大吞吐量,那麼 B50 是一款實用且經濟的選擇。其售價約為 349 美元,對於小型機箱、OEM 整合以及部署多個工作站節點的實驗室來說,極具性價比。如果您優先考慮的是安靜、可靠且能無縫整合到專業工作流程中的加速效能,那麼 Arc Pro B50 無疑是明智之選。

英特爾產品頁面

參與 StorageReview

電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱

布賴恩·比勒

Brian 位於俄亥俄州辛辛那提市,是 StorageReview.com 的首席分析師兼總裁。