AMD Radeon RX 9070 XT 評測:一款擁有強大遊戲效能的 1440p 強力顯示卡,但它在 AI 和效率方面能與 NVIDIA 抗衡嗎?
AMD Radeon RX 9070 系列版顯示卡今日推出。 AMD 將華碩 Prime RX 9070 和 RX 9070 XT 顯示卡送到實驗室進行測試。這些 GPU 是基於該公司尖端的 RDNA 4 架構和台積電先進的 4nm 製程技術,針對追求高刷新率 1440p 遊戲和入門級 4K 體驗的遊戲玩家,瞄準性價比的最佳平衡點。 9070 系列引入了令人印象深刻的技術進步,同時保持了相對於其性能等級的合理功耗數據。
這些 GPU 定位於中高端,將遊戲效能與 AI 加速相結合,滿足遊戲玩家和創作者的需求。 RX 16 系列配備 4GB VRAM、增強的光線追蹤功能以及 FidelityFX Super Resolution 9070 和 HYPR-RX 等 AMD 最新的 AI 技術,旨在提供高效能的同時保持電源效率。
RX 9070 XT 是高階型號,提供更高的時脈速度和更多的圖形核心,以滿足嚴苛的遊戲工作負載。 ASUS 的 PRIME 設計帶來強大的冷卻和電力傳輸,確保在重負載下保持一致的效能。這兩款 GPU 都面向未來,配備 PCIe gen 5、DisplayPort 2.1 支援和用於下一代應用程式的 AI 加速器,使其成為沉浸式遊戲體驗的理想選擇。
AMD Radeon RX 9070 和 RX 9070 XT 規格
Radeon RX 9070 XT 與 Radeon RX 9070 規格 | ||
Radeon RX 9070 XT | RX的Radeon 9070 | |
GPU名稱 | Navi 48 | Navi 48 |
GPU 變體 | 導航 48 XT | 導航 48 XL |
卓越的建築 | 脫氧核糖核酸4.0 | 脫氧核糖核酸4.0 |
鑄造廠 | TSMC | TSMC |
進程大小 | 4納米 | 4納米 |
晶體管 | 53,900萬元 | 53,900萬元 |
密度 | 151.0M/平方毫米 | 151.0M/平方毫米 |
模具尺寸 | 357平方毫米 | 357平方毫米 |
基地時鐘 | 2400 MHz | 2070 MHz |
提升時鐘 | 2970 MHz | 2520 MHz |
內存大小 | GB 16 | GB 16 |
內存類型 | GDDR6 | GDDR6 |
著色單元 | 4096 | 3584 |
人工智能加速器 | 128 | 112 |
TMU | 256 | 256 |
個ROPs | 128 | 128 |
計算單位 | 64 | 56 |
RT核心 | 64 | 56 |
AMD 無限高速緩存 | 64 MB(第三代) | 64 MB(第三代) |
內存總線 | 256位 | 256位 |
頻寬 | 640 GB / s | 640 GB / s |
峰值像素填充率 | 190.1 G像素/秒 | 161.3 G像素/秒 |
峰值紋理填滿率 | 730.3 GTexel/秒 | 564.5 GTexel/秒 |
峰值單精度吞吐量 | 48.7 TFLOPS | 36.1 TFLOPS |
峰值半精度吞吐量 | 97.3 TFLOPS | 72.3 TFLOPS |
峰值 INT8 AI TOPS 吞吐量 | 779 TOPS | 578 TOPS |
峰值 INT4 AI TOPS 吞吐量 | 1557 TOPS | 1156 TOPS |
TDP | 304W¯¯ | 220W¯¯ |
推薦電源 | 750W¯¯ | 650W¯¯ |
輸出 | 1 個 HDMI 2.1b、3 個 DisplayPort 2.1a | 1 個 HDMI 2.1b、3 個 DisplayPort 2.1a |
PCIe 接口 | PCIe 5.0 x 16 | PCIe 5.0 x 16 |
電源連接器 | 3x 8 針 | 2x 8 針 |
啟動價格 | $ 599 | $ 549 |
RDNA 4 的新功能
AMD 的 RDNA 4 架構代表了前幾代產品的重大演化,為多個領域帶來了實質的改進。這些新 GPU 的核心是重新設計的 RDNA4 計算單元,與 RDNA 40 相比,每個計算單元的效能提高了約 3%。
借助 AMD 第三代 RT 加速器,光線追蹤效能已顯著提升。增加第二個射線交叉引擎有效地使射線盒和射線三角形測試操作的吞吐量加倍,這是前幾代產品的關鍵瓶頸。新的專用射線變換硬體進一步加速了這些工作負載,而對定向邊界框的支援則能夠以更低的記憶體開銷實現更高效的射線遍歷。
也許最重要的進步來自於人工智慧加速能力。 RX 9070 系列採用第二代 AI 加速器,在使用稀疏性的 INT1,100 運算時,可為 9070 提供約 1,500 AI TOPS,為 9070 XT 提供超過 4 AI TOPS。這些專用的 AI 單元具有擴展的數學管道並支援新興的 AI 資料格式。
新的 FSR4 技術是 AMD 對 NVIDIA DLSS 升級的回應,利用增強的 AI 加速器來實現 AMD 所聲稱的優於原生影像品質。 FSR4 使用專門針對 RDNA 4 硬體優化的基於機器學習的升級演算法,可在保持出色影像保真度的同時提高效能。 AMD 設計的系統向後相容 FSR 3.1 API,從而允許開發人員輕鬆地將其實現到現有遊戲中。
建造和設計華碩 Prime RX 9070 和 RX 9070 XT
新款華碩 Prime Radeon 9070 與 9070 XT 顯示卡的構造與設計與 華碩 Prime RTX 5070 Ti 我們之前曾回顧過。它們在電源方面有所不同 - 兩款卡都不需要特殊的 12 針電源線,9070 使用標準 8 針電源和 2x 8 針連接器,而 9070 XT 使用 3x 8 針連接器。兩款卡均符合 2.5 PCIe 插槽設計高度要求。
為了散熱,華碩在 Radeon 9070 和 9070 XT 上採用了帶有雙滾珠軸承的三軸風扇設計,以提高耐用性並保持一致的氣流。風扇與整個卡上的大型散熱器和熱管配對,而通風背板和側面切口有助於最大限度地散熱。當 GPU 溫度降至 50°C 以下時,所有三個風扇均保持空閒狀態,從而能夠在輕負載或要求不高的遊戲過程中進行靜音運行。一旦溫度超過55°C,風扇就會自動恢復運轉。
從卡片的底部插槽側看,兩種型號具有相同的冷卻設計,具有相同的散熱器、PCB 佈局和帶有通風開口的罩殼以促進氣流。
兩張卡的末端具有相同的安裝點,用於安裝可選的卡加強筋,以防止卡在安裝在盒子中時下垂,並在運輸過程中提供額外的穩定性。
在兩款顯示卡的業務端,我們都有顯示連線選項,每個選項都配備 1 個 HDMI 2.1b 和 3 個 DisplayPort 2.1a 連接埠。華碩還採用了 304 不銹鋼 PCIe 支架設計,以確保使用壽命和耐用性。
這兩款顯示卡的其他顯著特點包括可切換的 BIOS,透過卡片上的開關進行控制,可在「P」(效能)模式和「Q」(安靜)模式之間切換。這兩個裝置還採用了相變導熱墊,旨在提高冷卻性能並延長與晶片接觸的導熱材料的使用壽命。最後,華碩提供 GPU Tweak III 軟體來微調顯示卡的效能以滿足特定要求。
基準測試:華碩 Prime RX 9070 與 RX 9070 XT
為了測試華碩的新款 Radeon 顯示卡,我們使用了高性能 AMD Threadripper 平台,該平台配備 64 核心 CPU 和客製化水冷循環。此設定可確保 GPU 滿載運行,而不會出現 CPU 瓶頸。為了進行比較,在此配置上測試了 ASUS Prime Radeon RX 9070 和 RX 9070 XT,以及 NVIDIA Founders RTX 4070 和 華碩 Prime NVIDIA RTX 5070 Ti.
以下是完整的系統配置。
StorageReview AMD Threadripper 測試平台
- 主板: 華碩 Pro WS TRX50-SAGE WIFI
- 中央處理器: AMD 銳龍 Threadripper 7980X 64 核心
- 隨機存取存儲器: 128GB DDR5 4800MT/秒
- 貯存: 2TB 三星 980 Pro
- 操作系統: Windows 11 Pro for Workstations
- 司機: AMD 腎上腺素 25.3.1
UL Procyon:人工智慧文字生成
Procyon AI 文字產生基準 透過提供緊湊、一致的評估方法簡化 AI LLM 性能測試。它允許跨多個 LLM 模型進行重複測試,同時最大限度地降低大模型尺寸和可變因素的複雜性。它與 AI 硬體領導者共同開發,優化了本地 AI 加速器的使用,以實現更可靠、更有效率的效能評估。以下測量的結果是使用 TensorRT 在 NVIDIA 模型上測試的,以及使用 ONNX 在 AMD 模型上測試的。
UL Procyon:人工智慧文字生成 | 的AMD Radeon RX 9070 | AMD Radeon RX 9070 XT | NVIDIA GeForce RTX 4070 | 華碩 PRIME NVIDIA RTX 5070 Ti | NVIDIA RTX 5070 |
Phi 總分 | 1,933 | 2,080 | 3,191 | 4,179 | 3,453 |
Phi 輸出到第一個代幣的時間 | 0.954小號 | 0.855小號 | 0.356小號 | 0.290小號 | 0.323小號 |
Phi 每秒輸出令牌 | 139.187 令牌/秒 | 144.471 令牌/秒 | 141.575 令牌/秒 | 192.487 令牌/秒 | 150.435 令牌/秒 |
Phi 總持續時間 | 26.989小號 | 25.587小號 | 21.743小號 | 15.771小號 | 20.302小號 |
米斯特拉爾總分 | 2,040 | 2.231小號 | 2,987 | 4,412 | 3,562 |
米斯特拉爾輸出第一個令牌的時間 | 1.109小號 | 0.946小號 | 0.508小號 | 0.374s | 0.433小號 |
米斯特拉爾每秒輸出令牌 | 101.300 令牌/秒 | 103.348 令牌/秒 | 99.590 令牌/秒 | 160.167 令牌/秒 | 120.507 令牌/秒 |
米斯特拉爾總持續時間 | 34.960小號 | 33.350小號 | 30.651小號 | 19.480小號 | 25.496小號 |
Llama3 總分 | 1,904 | 2,070 | 2,810 | 4,187 | 3,125 |
Llama3 輸出第一個令牌的時間 | 0.981小號 | 0.845小號 | 0.423 | 0.306小號 | 0.379小號 |
Llama3 每秒輸出令牌 | 87.594 令牌/秒 | 89.102 令牌/秒 | 82.130 令牌/秒 | 131.583 令牌/秒 | 100.388 令牌/秒 |
Llama3 整體持續時間 | 38.273小號 | 36.742小號 | 36.147小號 | 22.786小號 | 29.720小號 |
Llama2 總分 | 2,047 | 2,298 | 2,658 | 4,284 | 3,125 |
Llama2 輸出第一個令牌的時間 | 1.926小號 | 1.565小號 | 0.947小號 | 0.560小號 | 0.785小號 |
Llama2 每秒輸出令牌 | 59.673 令牌/秒 | 61.127 令牌/秒 | 49.487 令牌/秒 | 75.905 令牌/秒 | 56.647 個代幣/秒 |
Llama2 整體持續時間 | 59.100小號 | 55.520小號 | 61.300小號 | 39.545小號 | 53.234小號 |
在 UL Procyon AI 文字產生測試中,ASUS Prime NVIDIA RTX 5070 Ti 在所有型號中以最高的總體分數領先。它在 Phi 中獲得了 4,179 分,在 Mistral 中獲得了 4,412 分,在 Llama4,187 中獲得了 3 分,在 Llama4,284 中獲得了 2 分。 AMD Radeon RX 9070 XT 緊隨其後,在 Phi 中的得分為 2,080,在 Mistral 中的得分為 2,231,在 Llama2,070 中的得分為 3,在 Llama2,298 中的得分為 2。接下來是 NVIDIA GeForce RTX 4070,在 Phi 中得分為 3,191,在 Mistral 中得分為 2,987,在 Llama2,810 中得分為 3,在 Llama2,658 中得分為 2。 AMD Radeon RX 9070 在所有類別中的總體得分最低,在 Phi 中達到 1,933,在 Mistral 中達到 2,040,在 Llama1,904 中達到 3,在 Llama2,047 中達到 2。
UL Procyon: 人工智能圖像生成
Procyon AI 影像產生基準 持續準確地測量各種硬體(從低功耗 NPU 到高階 GPU)的 AI 推理效能。它包括三個測試:針對高階 GPU 的穩定擴散 XL (FP16)、針對中功率 GPU 的穩定擴散 1.5 (FP16) 和針對低功耗設備的穩定擴散 1.5 (INT8)。基準測試針對每個系統使用最佳推理引擎,確保結果公平且可比較。
UL Procyon:AI 影像產生(總分:越高越好) | 的AMD Radeon RX 9070 | AMD Radeon RX 9070 XT | NVIDIA GeForce RTX 4070 | 華碩 PRIME NVIDIA RTX 5070 Ti | NVIDIA RTX 5070 |
穩定擴散 1.5 (FP16) — 總體得分 | 2,280 | 2,598 | 2,400 | 3,755 | 2,937 |
穩定擴散 1.5 (FP16) — 總時間 | 43.858小號 | 38.481小號 | 41.661s | 26.625小號 | 34.038小號 |
穩定擴散 1.5 (FP16) — 影像產生速度 | 2.741 秒/影像 | 2.405 秒/影像 | 2.604 秒/影像 | 1.664 秒/影像 | 2.127 秒/影像 |
穩定擴散 1.5 (INT8) — 總體得分 | 不適用 | 不適用 | 31,048 | 46,744 | 36,320 |
穩定擴散 1.5 (INT8) — 總時間 | 不適用 | 不適用 | 8.052小號 | 5.348小號 | 6.883小號 |
穩定擴散 1.5 (INT8) — 影像生成速度 | 不適用 | 不適用 | 1.006 秒/影像 | 0.669 秒/影像 | 0.860 秒/影像 |
穩定擴散 XL (FP16) — 總體得分 | 1,805 | 2,010 | 1,940 | 3,352 | 2,473 |
穩定擴散 XL (FP16) — 總時間 | 332.400小號 | 298.499小號 | 309.269小號 | 178.946小號 | 242.606s |
穩定擴散 XL (FP16) — 影像產生速度 | 20.775 秒/影像 | 18.656 秒/影像 | 19.329 秒/影像 | 11.184 秒/影像 | 15.163 秒/影像 |
在 AI 影像生成測試中,重點關注穩定擴散 1.5 (FP16) 和穩定擴散 XL (FP16),AMD Radeon RX 9070 系列表現穩健,但落後於 NVIDIA。 RX 9070 得分為 2,280,RX 9070 XT 得分為 2,598,NVIDIA RTX 4070 得分為 2,400,華碩 Prime NVIDIA RTX 5070 Ti 以 3,755 位居榜首。 RX 9070 XT 在穩定擴散 XL (FP4070) 測試中表現略優於 16,得分為 2,010,但仍落後於 5070 Ti 的 3,352。 Radeon 卡的影像產生時間也比 5070 Ti 慢。
樂士馬克
Luxmark 是一個 GPU 基準測試,它使用開源光線追蹤渲染器 LuxRender 來評估系統在處理高度詳細的 3D 場景方面的效能。此基準測試適用於評估伺服器和工作站的圖形渲染能力,特別是對於視覺效果和建築視覺化應用程序,其中準確的光模擬至關重要。
Luxmark(越高越好) | 的AMD Radeon RX 9070 | AMD Radeon RX 9070 XT | NVIDIA GeForce RTX 4070 | 華碩 PRIME NVIDIA RTX 5070 Ti | NVIDIA RTX 5070 |
食物評分 | 8,233 | 8,610 | 7,535 | 12,073 | 9,061 |
霍爾分數 | 16,566 | 16,758 | 20,003 | 28,635 | 22,062 |
在 Luxmark 測試中,華碩 Prime NVIDIA RTX 5070 Ti 在兩個類別中均處於領先地位。它在食品測試中獲得了 12,073 分,在霍爾測試中獲得了 28,635 分,全面表現出色。 AMD Radeon RX 9070 XT 緊跟在後,在食品測試中獲得了 8,610 分,在霍爾測試中獲得了 16,758 分,略勝標準 RX 9070。測試中獲得了 9070 分。總體而言,RTX 8,233 Ti 明顯處於領先地位,而 16,566 在兩項測試中都落後。
Geekbench 6
Geekbench 6 是衡量整體系統效能的跨平台基準測試。 Geekbench 瀏覽器可讓您將任何系統與其進行比較。
Geekbench(越高越好) | 的AMD Radeon RX 9070 | AMD Radeon RX 9070 XT | NVIDIA GeForce RTX 4070 | 華碩 PRIME NVIDIA RTX 5070 Ti | NVIDIA RTX 5070 |
GPU OpenCL 分數 | 138,463 | 173,255 | 174,725 | 246,875 | 188,892 |
在 Geekbench GPU OpenCL 測試中,華碩 Prime NVIDIA RTX 5070 Ti 以 246,875 的強勁得分領先,明顯超越競爭對手。緊隨其後的是 NVIDIA GeForce RTX 4070,得分為 174,725,領先兩款 AMD Radeon 顯示卡。緊隨其後的是 AMD Radeon RX 9070 XT,得分為 173,255,略低於 RTX 4070。
3D馬克
3DMark Port Royal、Speed Way 和 Steel Nomad 是測試不同場景下效能的 GPU 基準測試。 Port Royal 專注於光線追踪,Speed Way 評估賽車模擬中的性能,Steel Nomad 則以高強度、逼真的圖形挑戰 GPU。它們評估 GPU 在渲染、照明和動態場景方面的能力。
3DMark 測驗(分數越高越好) | 的AMD Radeon RX 9070 | AMD Radeon RX 9070 XT | NVIDIA GeForce RTX 4070 | 華碩 PRIME NVIDIA RTX 5070 Ti | NVIDIA RTX 5070 |
皇家港口 | 15,760 | 17,989 | 11,074 | 19,290 | 14,026 |
速度之路 | 5,791 | 6,237 | 4,477 | 7,709 | 5,869 |
鋼鐵游牧者 | 5,992 | 6,977 | 3,748 | 6,458 | 5,019 |
在以遊戲為中心的 3DMark 基準測試中,AMD Radeon RX 9070 和 9070 XT 的表現優於 NVIDIA RTX 5070,其中 AMD Radeon RX 9070 平均高出 17%,RX 9070 XT 平均高出 28%。雖然 RTX 5070 在光線追蹤方面佔有一席之地,但 AMD 的顯示卡在原始遊戲效能方面提供了更強大的選擇。
功耗:華碩 Prime Radeon RX 9070 XT
功耗是任何高端或低端運算平台的重要組成部分。每一代新的 GPU 在負載下都會消耗更多的電量,這意味著需要更大的電源和充足的氣流來冷卻。然而,效能方面還有另一個面向:更快的 GPU 可能會達到更高的峰值,但每個工作負載的持續時間會減少。
我們測試了華碩 PRIME RX 9070 XT 的功耗,其 TDP 額定值為 304W。在Procyon AI影像產生測試中,功耗從空閒時的243W上升到負載下的849W,增加了606W。負載下的平均功耗約為 676W。這比同期的 NVIDIA 型號要高得多,為整個系統帶來了更大的負載。
倒數第二張圖像僅用了 17.4 秒就生成,在此期間系統消耗了 3.41Wh。
電源測試 總結 |
AMD 9070 XT | NVIDIA RTX 5070 | 華碩 Prime NVIDIA RTX 5070 Ti | NVIDIA RTX 5080 | NVIDIA RTX 5090 |
耗電量 | 3.41Wh | 2.46Wh | 1.66Wh | 1.39Wh | 1.16Wh |
測試時間 | 17.4小號 | 19.2小號 | 11.1小號 | 8.7小號 | 5.1小號 |
結論
AMD 的華碩 Prime Radeon RX 9070 系列兼具高效能、高效率和實惠性,是遊戲玩家和內容創作者的絕佳選擇。這些基於 RDNA 4 架構的 GPU 在處理入門級 AI 工作負載的同時,在 1440p 和 4K 遊戲方面表現出色。 RX 16 配備 6GB GDDR9070 內存,可確保為繁重的任務提供充足的頻寬。
第三代光線追蹤 (RT) 加速器提供了重大改進,包括第二個光線交叉引擎和優化,使光線遍歷能力比以前的 RDNA 3 提高一倍,從而增強了光線追蹤性能。此外,RX 3 系列支援第二代 AI 加速器,透過支援新資料類型和優化,提升 AI 效能以加快遊戲和內容創作的處理速度。
華碩 Prime Radeon RX 9070 系列在遊戲工作負載方面表現出色,但在 AI 任務方面表現落後。在影像生成等領域,9070 XT 比 NVIDIA 同類產品在完成相同工作時消耗更多的電力。更高的功耗會影響延長工作負載期間的效率,而 NVIDIA 在效率和 AI 任務方面佔有優勢。然而,RX 9070 系列以更實惠的價格提供了強大的效果,對於尋求 AI 加速和通用性能的用戶來說,它是一個有吸引力的選擇。雖然驅動程式限制了一些人工智慧工作負載,但隨著顯示卡的成熟,我們預計這方面將會成長,而且我們仍然樂觀地認為,AMD 在這一類別的持續投資將獲得回報,並為消費者提供更多選擇。
參與 StorageReview
電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱