存儲評論網

AMD Ryzen Threadripper 9980X 和 9970X 評測:Zen 5 帶來巨大提升

消費者  ◇  工作站

AMD 持續升級高階桌上型產品線,推出全新銳龍 Threadripper 9980X 和 9970X。這兩款新晶片基於最新的 Zen 5 架構,面向在多執行緒環境中工作的專業用戶,例如 3D 渲染、視訊製作、軟體編譯和科學運算工作負載。它們也標誌著 TRX50 平台的最新成員。 TRX50 平台是 AMD 的發燒級基礎架構,將工作站級效能與桌上型電腦的易用性完美結合。 TRX5 支援超頻,配備 PCIe Gen5 和四通道 DDR90 內存,對於不需要 WRXXNUMX 平台完整功能的用戶來說,TRXXNUMX 是一個更具成本效益的選擇。

AMD Ryzen Threadripper 9980X

雖然型號名稱耳熟能詳,但新款 Threadripper CPU 的內部架構卻發生了顯著變化。 9980X 採用 64 核心 128 執行緒佈局,採用 12+1 CCD(核心複合晶片)配置;這意味著 9970 個運算 CCD 與單一 I/O 晶片配對,這與 AMD 基於 chiplet 的高階晶片擴充策略一致。 32X 透過 64+6 CCD 佈局將其精簡為 1 核心 XNUMX 線程。

這兩款 CPU 均基於 AMD 最新的 Zen 5 架構,採用 4nm 製程製造,並支援 AVX-512 和完整的 512 位元資料路徑,這在 Threadripper 層級中尚屬首創。 Boost 頻率最高可達 5.4GHz,搭配高達 256MB 的三級緩存,平台支援包括 3 條 PCIe Gen 80 通道和四通道 DDR5-5 內存,為這些晶片提供了充足的頻寬和 I/O,足以處理要求嚴苛的創意和模擬工作負載。

AMD Threadripper 9980X 和 9970X:Zen 5 架構與平台

Zen 5 架構帶來了一些重大改進,這意味著在專業工作負載下效能將獲得顯著提升。其核心是重新設計的前端,改進了分支預測、擴展了指令調度範圍並提高了調度效率,所有這些都有助於提高指令吞吐量。該架構的升級執行引擎擁有更寬的整數和浮點管線,從而實現了更高的吞吐量並支援更新的資料類型,這對於計算密集型工作負載尤其有用。

Zen 5 架構

Zen 5 還引入了完全優化的 AVX-512 實現,具有原生 512 位元執行性能(此前,在 Zen 512 中,AVX-256 以兩個週期的分割 4 位元模式支援),首次將高吞吐量向量處理功能引入主流 Threadripper 系列。這在浮點運算強度較高的科學和工程應用中尤其重要。支援此架構的是響應速度更快的快取層次結構,每個 CCD 提供高達 32MB 的 L3 緩存,並透過改進的 L1/L2 結構和更寬的加載/儲存引擎實現更快的存取速度。

該平台還保留了 sTR5 插槽,這意味著在安裝和基礎架構方面具有向後相容性,但 TRX50 和 WRX90 主機板將提供更廣泛的支援。 TRX50 支援 4 通道 DDR5-6400 記憶體和 80 條 PCIe Gen5 通道,而 WRX90 可擴展至 8 通道記憶體和 128 條 PCIe Gen5 通道,適用於真正頻寬受限的環境。兩個平台均支援 ECC RDIMM 記憶體。

由於 Zen 5 改良的電源門控和更精細的升壓行為,電源管理也得到了提升。這些增強功能有助於在負載下保持更高的持續頻率,同時在空閒或輕執行緒場景下提供更好的效率擴展。

AMD Ryzen Threadripper 9000 系列 Zen5 SKU

Ryzen Threadripper 9000 系列透過兩條產品線將 Zen 5 引入 HEDT 和工作站市場:標準「X」 SKU(例如 9980X、9970X、7960X)和「WX」 PRO 版本(96WX 最多 7995 個核心)。雖然核心數量與上一代相似,但 Zen 5 允許更高的主頻和更強大的單核性能。所有 SKU 均具有 350W TDP,並支援在支援的主機板上進行超頻。

值得注意的是,Threadripper 9000 CPU 均不具備整合式顯示卡,這表示任何顯示輸出都需要獨立的 GPU。

型號 CPU 核心數 # 線程 最大限度。 升壓時鐘 基地時鐘 默認 TDP
AMD Ryzen Threadripper 9980X 64 128 高達5.4GHz 3.2GHz 350W
AMD Ryzen Threadripper 9970X 32 64 高達5.4GHz 4.0GHz 350W
AMD Ryzen Threadripper 7980X 64 128 高達5.1GHz 3.2GHz 350W
AMD Ryzen Threadripper 7970X 32 64 高達5.3GHz 4.0GHz 350W
AMD Ryzen Threadripper 7960X 24 48 高達5.3GHz 4.2GHz 350W
AMD 銳龍 Threadripper PRO 7995WX 96 192 高達5.1GHz 2.5GHz 350W
AMD 銳龍 Threadripper PRO 7985WX 64 128 高達5.1GHz 3.2GHz 350W
AMD 銳龍 Threadripper PRO 7975WX 32 64 高達5.3GHz 4.0GHz 350W
AMD 銳龍 Threadripper PRO 7965WX 24 48 高達5.3GHz 4.2GHz 350W
AMD 銳龍 Threadripper PRO 7955WX 16 32 高達5.3GHz 4.5GHz 350W
AMD 銳龍 Threadripper PRO 7945WX 12 24 高達5.3GHz 4.7GHz 350W

AMD Threadripper 9980X 和 9970X:Zen5 的潛在實際效能

AMD Zen 5 核心的使用使得單核心效率相較 Zen 4 有了顯著提升。根據 AMD 使用固定頻率(例如上文提到的 9980X 12+1 CCD 配置)進行的內部測試,Zen 5 在 16 個工作站基準測試的幾何平均值中平均實現了約 10% 的 IPC 提升。這反映了核心前端效率、分支預測和調度的普遍提升。在與 AI 和機器學習明確相關的工作負載中,AMD 報告稱其在 SPEC 工作站測試中獲得了約 25% 的提升,這些測試專注於浮點效能和推理相關任務。這些提升對用戶至關重要。

AMD ryzen Threadripper 9980X CPU英雄

在直接比較 AMD 的 64 核心 Threadripper 9980X 和英特爾的 60 核心 Xeon W9-3595X 時,AMD 聲稱其在各種專業工作負載下都實現了顯著的效能提升。 Autodesk Maya 和 Cinebench (nT) 等應用程式的效能提升分別高達 92% 和 83%,凸顯了此晶片處理多執行緒渲染和運算密集型任務的能力。

在內容創作方面,Adobe Premiere Pro 和 After Effects 的效能提升分別高達 22% 和 80%。視覺化和 3D 渲染工作負載也受益匪淺,其中 Autodesk Revit 的效能提升高達 41%,Corona Render 的效能提升高達 108%。在軟體開發方面,MATLAB、Chromium 編譯器和 Unreal Engine 編譯器的效能提升分別高達 41% 和 68%。這表明,9980X 能夠在創意、工程和開發等高核心利用率和高效率的場景中表現出色。

AMD 聲稱,儘管核心數量較少,但 32 核心 Threadripper 9970X 的效能相比英特爾 44 核心 Xeon W9-3575X 仍有顯著提升。在創意工作負載方面,AMD 報告指出 Adob​​e Premiere Pro 的效能提升高達 31%,After Effects 的效能提升高達 79%。 Maya 和 Cinebench (nT) 的效能也顯著提升,分別提升 26% 和 18%。在 CAD 和視覺化任務方面,Autodesk Revit 的效能提升了 45%,Corona Render 的效能提升了 35%,這表明設計和渲染方面均有顯著優勢。

最顯著的飛躍是在 MATLAB 方面,AMD 報告稱其性能提升了 137%,這意味著它在模擬和科學計算方面具有真正的優勢。在開發方面,虛幻引擎的編譯速度提升了 69%,甚至 Chromium 的編譯速度也提升了 10%,儘管速度不快,但仍值得衡量。雖然我們無法驗證所有這些說法,但我們將一如既往地在基準測試和實際測試中驗證這些效能數據是否屬實。

AMD Threadripper 9980X 和 9970X:用例

AMD Threadripper 9980X 和 9970X CPU 專為處理嚴肅的專業工作負載而設計,其預期用例涵蓋多個高需求領域。在 3D CAD 環境中,這些晶片旨在加速 AI 輔助設計工作流程、複雜的 3D 渲染和產品視覺化流程。其高線程數和強大的浮點性能使其非常適合計算密集型的模擬任務。同樣,在建築視覺化領域,這些 CPU 旨在處理大型複雜模型的逼真渲染,並支援沉浸式即時漫遊和虛擬實境預覽,這對於現代設計驗證至關重要。

AMD 線程撕裂者 9970X

在內容創作領域,AMD 專注於支援高負載 VFX 管線,特別強調 8K120(高幀率)工作負載。這對於虛擬製作環境和虛擬場景中的即時渲染來說非常理想。 AI 增強的視訊處理、調色和轉碼功能也受惠於全新 Threadripper 架構。

在軟體開發方面,AMD 表示,它們將與 LLM 的本地 AI 模型開發和微調完美契合。 AMD 也提到了油氣探勘、影像和資料處理以及編碼輔助工具等工作負載。 9980X 和 9970X 的多核心效能和頻寬有望在這些領域帶來明顯優勢,而從歷史上看,Threadripper CPU 也確實如此。

AMD Threadripper 9980X 和 9970X:使用 Zen 5 進行超頻

Threadripper 9000 系列的超頻支援與前幾代產品相似,Precision Boost Overdrive (PBO) 可根據主機板 VRM 和 BIOS 定義的功率輸出限制進行調整。 PPT、TDC 和 EDC 等功率閾值會自動調整,同時使用者可以應用 Auto-OC 將升壓頻率提高高達 200 MHz。 Zen 5 的改進對此有所幫助,尤其是更好的分支預測和更短的電源狀態轉換時間,使升壓能夠持續更長時間並更快地恢復。 AMD 的曲線優化器也可用,提供每核電壓調節,有助於改善頻率擴展或降低發熱量,同時保持相同的功率範圍。

手動調校仍然可行,但 AMD 建議認真考慮散熱和電源容量以確保穩定性。對於挑戰極限的用戶,建議使用 1500W 電源供應器和高階液冷式散熱器,因為滿載下的總功耗可能超過 800W。頻率可以跨所有核心或按 CCX 進行調整,Zen 5 統一了按 CCX 和按 CCD 進行的調整行為。電壓可以設定為靜態值或偏移量,一旦找到穩定的超頻,使用者可能會受益於 SOC 電壓的微調。由於 Zen 5 在效率和調度方面的優化,Threadripper 9000 系列能夠更好地在高負載下保持更高性能,並降低熱量和電壓不穩定性。

在下面的性能部分中,我們將確定它們是否確實是 Threadripper 已經做得很好的改進,以及它們是否在相同的佔用空間下提供了更多功能。

性能測試

我們將在基於華碩 Pro WS TRX9980-SAGE WIFI 主機板構建的高效能工作站平台上測試全新的 AMD 銳龍 Threadripper 9970X 和 50X CPU。該測試平台先前曾用於評估上一代 Threadripper CPU 和高階 GPU,因此是進行持續效能比較的理想基礎。本系統採用全水冷設計,確保在持續高負載下也能維持最佳散熱管理。

搭載 AMD ryzen Threadripper 9980X

StorageReview AMD ThreadRipper 測試平台

  • 主板: 華碩 Pro WS TRX50-SAGE WIFI
  • 隨機存取存儲器: 128GB DDR5 6400MT/秒
  • 貯存: 2TB 三星 980 Pro
  • 操作系統: Windows 11 Pro 工作站版和 Ubuntu Server 24.04
經過測試的 Threadripper CPU

UL Procyon:AI 電腦視覺推理

UL 南河三 AI 推理旨在評估工作站在專業應用中的表現。需要注意的是,此測試不利用多 CPU 功能。具體來說,此工具旨在評估工作站處理 AI 驅動任務和工作流程的能力,並詳細評估其處理複雜 AI 演算法和應用程式的效率和速度。

在 UL Procyon 的 AI 電腦視覺測試中,兩款全新 Threadrippers 的推理時間均較上一代產品有顯著提升,尤其是在複雜模型中。 9970X 的總得分最高,為 240 分;其次是 9980X,得分為 222 分,遠超 7980X 的 154 分和 7970X 的 187 分。

UL Procyon:AI 電腦視覺推理時間 CPU(越低越好) Threadripper 9980X 64C Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
移動網V3 3.58ms 1.68ms 3.66ms 2.08ms
殘差網絡 50 5.09ms 5.07ms 6.33ms 5.74ms
盜夢空間V4 14.63ms 13.50ms 23.84ms 21.35ms
深實驗室V3 19.76ms 21.20ms 31.22ms 25.66ms
優洛V3 21.71ms 24.95ms 32.44ms 31.91ms
真實ESRGAN 1,122.61ms 1,312ms 2,059.92ms 1,704.68ms
總分(越高越好) 222 240 154 187

規格工作站 4

SPECworkstation 4.0 基準測試是一個綜合工具,可以評估工作站效能的所有關鍵方面。 它提供了 CPU、圖形、加速器和磁碟效能的真實衡量標準,確保專業人員擁有資料來對其硬體投資做出明智的決策。 此基準測試包括一組專門針對 AI 和 ML 工作負載的測試,包括資料科學任務和基於 ONNX 執行時間的推理測試,反映了 AI/ML 在工作站環境中日益增長的重要性。 它涵蓋七個垂直行業和四個硬體子系統,為當今工作站的性能提供了詳細而相關的衡量標準。

在 SPECworkstation 4.0.0 測試中,AMD 全新 Threadripper 9980X(64 核心)和 9970X(32 核心)相較上一代產品取得了顯著提升。與 9980X 相比,6.88X 在能源(5.75 vs. 7.82)和金融服務(6.98 vs. 7980)等高線程工作負載方面始終保持領先,展現出明顯的代際提升。在人工智慧和機器學習領域,它以 4.28 vs. 3.56 的成績略勝一籌,同時在生命科學和媒體與娛樂領域也略有領先。

9970X 的核心數量雖然只有 9980X 的一半,但在各方面仍然勝過 7970X。值得注意的是,它在生產力與開發方面的得分為 3.00,優於兩款 64 核心晶片,這表明其更高的主頻和更低的核心爭用率有利於輕執行緒任務的執行。

SPECworkstation 4.0.0(越高越好) Threadripper 9980X 64C  Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
人工智慧與機器學習 4.28 3.89 3.56 3.22
能源 6.88 4.63 5.75 4.04
金融服務 7.82 4.94 6.98 4.44
生命科學 4.70 3.77 4.17 3.38
媒體與娛樂 4.43 3.84 4.14 3.54
生產力與發展 1.57 3.00 1.51 1.43
產品設計 3.56 1.54 3.23 2.74

3DMark CPU 配置文件

3DMark CPU Profile 評估處理器在六個執行緒層級下的效能:1、2、4、8、16 和最大執行緒。每個測試運行相同的基於個體的模擬工作負載,以評估 CPU 在不同執行緒數下(GPU 參與度最低)的擴展效能。此基準測試有助於確定單執行緒效率以及遊戲、內容創作和渲染等任務的多執行緒潛力。 12 個執行緒的分數通常與現代 DirectX 1 遊戲表現一致,而 4-XNUMX 個執行緒的結果則反映較老的遊戲或電競遊戲場景。

在 3DMark 的 CPU Profile 測試中,AMD 的 Threadripper 9980X 和 9970X 相比 7980X 和 7970X 表現出了明顯的效能提升,尤其是在執行緒數增加的情況下。在最大線程數下,9980X 的得分達到 30,442,比 21X 的 7980 提升了 25,224%;而 9970X 的得分為 23,771,比 15X 提升了 7970%。

兩代產品的 1 執行緒和 2 執行緒效能幾乎相同,這表明 AMD 在此版本中優先考慮多執行緒擴充而不是單執行緒改進。

當執行緒數達到 16 時,效能差距開始更加明顯;而當執行緒數達到 9970 時,9980X 的得分為 17,049 分,而 15,526X 的得分為 9970 分,領先優勢更加明顯。這很可能反映了 9980X 在核心數量較少的情況下擁有更高的效能提升。當所有核心都滿載運轉時,XNUMXX 便會明顯領先。

3DMark CPU 設定檔(越高越好) Threadripper 9980X 64C  Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
1主題 1,245 1,243 1,103 1,123
2 線程 2,477 2,471 2,136 2,193
4 線程 4,691 4,866 4,132 4,223
8 線程 9,041 9,071 7,285 7,482
16 線程 15,526 17,049 13,843 13,775
最大線程數 30,442 23,771 25,224 20,593

Geekbench 6

Geekbench 6 跨平台基準測試可衡量系統效能並提供比較分數。它旨在在多個平台上運行,並在各種設備(包括智慧型手機、平板電腦、桌上型電腦和伺服器)上提供一致的效能測量。

在 Geekbench 6 跑分中,新款 AMD CPU 的單核心效能略有提升,9980X 和 9970X 的得分分別為 3,267 分和 3,260 分。相較於 7980X 和 7970X 的 2,956 分和 2,940 分,這些只是小幅提升。兩者之間的微小差距凸顯了 AMD 架構的改進,而非徹底的重新設計。

有趣的是多核心性能。 9970X 以 28,039 分的成績位居榜首,甚至超過了 64 核 9980X(26,621 分)。這項結果表明,在 Geekbench 的測試環境下,32 核心處理器的效能提升更為強勁。不過,這兩款晶片都比上一代產品取得了顯著提升,7980X 為 24,812 分,7970X 為 21,836 分。

Geekbench 6(越高越好) Threadripper 9980X 64C Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
單核 3,267 3,260 2,956 2,940
多核 26,621 28,039 24,812 21,836

Blackmagic RAW 速度測試

我們進行了 Blackmagic RAW 速度測試,以評估新 AMD CPU 在未安裝 GPU 的情況下,僅使用 CPU 處理 Blackmagic RAW 解碼任務的效能。此測試衡量了不同解析度和壓縮等級下的性能。

在 RAW 速度測試中,9970X 在基於 CPU 的 8K 處理中表現出色,達到了 202 FPS,略高於 9980X 的 187 FPS。舊款 7980X 的 FPS 略低,為 151 FPS,而 7970X 的 FPS 幾乎與新款 32 核心晶片持平,為 197 FPS,這可能是因為在特定工作負載下,兩者的時脈行為相似。

RAW速度測試 Threadripper 9980X 64C Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
8K CPU FPS 187 202 151 197

PCMark 10

PCMark 10 是一款業界標準基準測試,旨在衡量現代辦公室環境中的完整系統效能。它針對 Windows 10 系統更新了工作負載,並評估日常任務,例如生產力、網頁瀏覽、視訊會議和內容創作。此基準測試運行簡單,提供多層次評分(從高等級的總體評分到詳細的工作負載評分),並包含專門的電池續航時間和儲存測試。雖然 UL Solutions 現在推薦使用 Procyon 進行基於應用程式的較新測試,但 PCMark 10 仍然是評估一般 PC 效能的可靠且廣泛使用的工具。

在 PCMark 10 測試中,9980X 得分 9,406,9970X 得分 9,398。這些結果顯示,與 7980X 的 8,467 和 7970X 的 8,614 相比,新一代產品的效能提升了約 10%。

64 核心和 32 核心型號的效能幾乎相同,這表明 PCMark 的工作負載更依賴時脈速度和效率,而非原始核心數量。這一趨勢在兩代產品中都保持一致。

PCMark 10(越高越好) Threadripper 9980X 64C Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
CPU 得分 9,406 9,398 8,467 8,614

Maxon Cinebench

Cinebench 是一種廣泛使用的基準測試工具,它使用 Maxon Cinema 4D 進行渲染來測量 CPU 和 GPU 的效能。它提供的分數可讓您比較不同系統和組件的效能。我們運行了四個流行的 Cinebench 版本,以便您可以比較線上流行排行榜上的結果。

在 Cinebench 2024 中,9980X 的多核心表現領先,得分為 6,429 分,比 15X 的 7980 分提升了 5,575%。 9970X 的得分為 4,083 分,高於 7970X 的 3,571 分,這標誌著 32 核型號的得分也有類似的提升。

所有晶片的單核得分都比較接近。 9970X 以 128 分領先,緊隨其後的是 9980X,得分為 126 分,而兩款上一代晶片的得分均為 115 分。這反映出不同世代之間每核心效能的架構提升較為有限。

Cinebench 2024(越高越好) Threadripper 9980X 64C  Threadripper 9970X 32C Threadripper 7980X 64C  Threadripper 7970X 32C
CPU(多核心) 6,429點 4,083點 5,575點 3,571點
CPU(單核心) 126點 128點 115點 115點

在 Cinebench 2023 測試中,9980X 的多核得分為 115,279 分,比 15X 的 7980 分提升了 100,009%;而 9970X 的多核得分則達到了 76,075 分,比 7970X 64,916 分,比 17X XNUMX 分的提高了約 XNUMX。這顯示兩個核心層級的表現都得到了一致的提升。

單核心效能方面,新一代處理器保持穩定。 9980X 和 9970X 的得分均略高於 2,190 分,而上一代型號的得分分別為 1,969 分和 2,007 分。這些結果證實了新一代處理器在單執行緒響應速度方面略有提升,而在多核心方面則有更顯著的提升。

Cinebench R23(越高越好) Threadripper 9980X 64C  Threadripper 9970X 32C Threadripper 7980X 64C  Threadripper 7970X 32C
CPU(多核心) 115,279點 76,075點 100,009點 64,916點
CPU(單核心) 2,191點 2,192點 1,969點 2,007點

y 粉碎機

y-cruncher 是一款多執行緒、可擴展的程序,能夠計算圓周率 (Pi) 和其他精確到兆位元的數學常數。自 2009 年推出以來,它已成為超頻玩家和硬體愛好者熱衷的基準測試和壓力測試應用程式。

在 y-cruncher 測試中,9980X 在所有 Pi 計算規模上的表現均優於 7980X。在 10 億位上,它只需 88.97 秒即可完成,比 14X 的 7980 秒提升了近 102.77 秒。 9970X 的效能也比 7970X 有所提升,但由於核心數量較少,在處理較大資料集時,差距較小。

在 1 億位運算下,9970X 最快完成時間為 7.25 秒,略勝 9980X。 10X 僅在工作負載超過 XNUMX 億位時才領先。這反映出它在輕負載下具有更好的加速性能。

在對記憶體和快取更敏感的 BBP 測試中,9980X 在各個層級都處於領先地位。例如,在 100 億位運算中,它用時 16.07 秒,明顯快於 7980X 的 25.70 秒和 9970X 的 24.15 秒。與 7970X 相比,差距更大,後者用時 41.89 秒。

y-cruncher 總計算時間 (越低越好) Threadripper 9980X 64C  Threadripper 9970X 32C Threadripper 7980X 64C  Threadripper 7970X 32C
1億PI 8.032秒 7.250秒 9.288秒 8.825秒
2.5億PI 20.456秒 19.577秒 23.395秒 23.810秒
5億PI 41.962秒 42.413秒 48.924秒 51.326秒
10億PI 88.972秒 92.795秒 102.774秒 111.965秒
25億PI 249.660秒 264.683 秒 284.471秒 319.469秒
1億PI BBP 0.213秒 0.226秒 0.293秒 0.369秒
10億PI BBP 1.522秒 2.201秒 2.358秒 3.810秒
100億PI BBP 16.070秒 24.147秒 25.701秒 41.896秒

攪拌機優化

Blender OptiX 是一款開源 3D 建模應用程式。此基準測試使用 Blender Benchmark CLI 實用程式運行。分數以每分鐘採樣數計算,數值越高越好。

在 Blender 4.3 中,9980X 在所有場景中均處於領先地位,在 Monster 測試中每分鐘可獲得 867.30 個樣本,比 16X 的 7980 個樣本提升了 746.73%。 9970X 也展現出明顯的世代提升,得分為 503.43,而 7970X 為 440.73,提升了約 14%。

類似的趨勢也出現在「舊貨店」和「教室」場景中。 9980X 以 620.86 分和 429.83 分保持領先,而 9970X 則以 359.39 分和 254.06 分領先,均優於上一代產品。

Blender 4.3 每分鐘 CPU 樣本數(越高越好) Threadripper 9980X 64C Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
Monster 867.30 503.43 746.73 440.73
舊貨店 620.86 359.39 535.06 312.17
課堂 429.83 254.06 378.69 224.50

7-Zip 壓縮基準

7-Zip 公用程式中的內建記憶體基準測試可測量壓縮和解壓縮任務期間系統 CPU 和記憶體的效能,顯示系統處理資料密集型操作的能力。如果可能,我們以 128MB 字典大小執行此測試。 

在 7-Zip 基準測試中,各代產品之間的整體效能差異很小。 9970X 以 376.30 GIPS 的總成績略微領先,略高於 9980X 的 372.74 GIPS。上一代 7980X 的整體成績最高,為 380.49 GIPS,7970X 緊隨其後,為 375.48 GIPS。

7-Zip 壓縮基準 (越高越好) Threadripper 9980X 64C Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
壓縮
當前 CPU 使用率 5,789% 5,664% 5,701% 5,648%
當前額定值/使用情況 5.283 吉普斯 5.361 吉普斯 5.251 吉普斯 5.257 吉普斯
額定電流 305.856 吉普斯 303.636 吉普斯 299.398 吉普斯 296.903 吉普斯
產生的 CPU 使用率 5,785% 5,670% 5,687% 5,618%
結果評級/使用情況 5.286 吉普斯 5.352 吉普斯 5.210 吉普斯 5.269 吉普斯
結果評級 305.776 吉普斯 303.458 吉普斯 296.314 吉普斯 296.012 吉普斯
解壓縮
當前 CPU 使用率 6,150% 6,258% 6,254% 6,335%
當前額定值/使用情況  7.170 吉普斯 7.334 吉普斯 7.397 吉普斯 7.195 吉普斯
額定電流 440.961 吉普斯 458.971 吉普斯 462.602 吉普斯 455.836 吉普斯
產生的 CPU 使用率 6,177% 6,123% 6,144% 6,309
結果評級/使用情況 7.119 吉普斯 7.335 吉普斯 7.563 吉普斯 7.212 吉普斯
結果評級 439.708 吉普斯 449.133 吉普斯 464.659 吉普斯 454.943 吉普斯
總評分
總 CPU 使用率 5,981% 5,897% 5,916% 5,963%
總評分/使用情況 6.202 吉普斯 6.343 吉普斯 6.387 吉普斯 6.240 吉普斯
總評分 372.742 吉普斯 376.295 吉普斯 380.486 吉普斯 375.478 吉普斯

vLLM 工作量

vLLM 基準測試使用大型語言模型模擬推理效能。它重點關注 CPU 如何有效地管理令牌生成、延遲和整體吞吐量,同時強調並發性、記憶體頻寬和調度。這些對於本機 AI 開發和推理工作負載至關重要,因為 CPU 端效能仍然至關重要。

在 vLLM 推理基準測試中,Threadripper 9980X 的整體效能最強,僅用 193.05 秒就完成了測試,總令牌吞吐量為 175.20 tok/s。緊隨其後的是 9970X,耗時 231.56 秒,吞吐量為 146.06 tok/s。儘管如此,與上一代 7970X 相比,Threadripper 263.07X 仍然取得了顯著的提升,後者耗時 128.56 秒,吞吐量為 XNUMX tok/s。

9980X 在延遲指標方面也處於領先地位,其平均首次令牌時間 (TTFT) 為 6,235 毫秒,中位數 TTFT 為 2,789 毫秒,而 7,350X 的平均 TTFT 為 7,697 毫秒,中位數為 9970 毫秒。雖然 7980X 的 TTFT 與 9980X 相似,但在吞吐量和生成效率方面卻落後。

在持續產生方面,9980X 的每輸出令牌時間 (TPOT) 最低,為 84.77 毫秒,而 9970X 則為 102.06 毫秒。令牌間延遲 (ITL) 也呈現相同的趨勢,9980X 以 85.18 毫秒領先,而 102.28 則為 9970 毫秒。

指標(持續時間越短/tok/s 越高越好) Threadripper 9980X 64C Threadripper 9970X 32C Threadripper 7980X 64C Threadripper 7970X 32C
成功的請求 16 16 16 16
基準持續時間(秒) 193.05 231.56 234.98 263.07
總輸入令牌 20,308 20,308 20,308 20,308
代幣總生成量 13,513 13,513 13,513 13,513
請求吞吐量(req/s) 0.08 0.07 0.07 0.06
輸出令牌吞吐量(tok/s) 70.00 58.36 57.51 51.37
總代幣吞吐量(tok/s): 175.20 146.06 143.93 128.56
第一個令牌的時間(TTFT)(延遲越低越好)
平均TTFT(毫秒) 6,235.77 7,350.04 6,015.70 9,368.04
中位TTFT(毫秒) 2,789.67 7,697.26 3,015.48 4,464.59
P99 TTFT(毫秒) 12,172.51 14,720.60 11,379.67 19,731.04
每個輸出令牌的時間(TPOT,不包括第一個令牌)(延遲越低越好)
平均 TPOT(毫秒) 84.77 102.06 104.14 114.59
中位數 TPOT(毫秒) 84.27 103.94 97.14 113.36
P99 TPOT(毫秒) 101.02 110.97 98.98 138.15
令牌間延遲(ITL)(延遲越低越好)
平均 ITL(毫秒) 85.18 102.28 98.92 115.95
中位 ITL(毫秒) 78.74 93.37 97.14 104.08
P99 ITL(毫秒) 80.60 95.01 98.92 105.74

結語

從 Threadripper 9980X 和 9970X 可以看出,Zen 5 帶來了一系列直接影響實際工作負載的改進,從而帶來了顯著的效能提升。將 Threadripper 9980X 與上一代 7980X 進行比較:在 UL Procyon AI 推理測試中,9980X 縮短了複雜模型的運行時間,總分從 7980X 的 154 分躍升至 222 分,這使得 MobileNet 和 Inception 的運行速度感覺更快。在 SPECworkstation 測試中,它在能源和金融服務等領域也處於領先地位,在每個類別中都領先 15X 大約一分或更多。 Cinebench 多核心顯示出類似的結果,例如比舊款 64 核心增加了 3%,而 9980DMark 的 CPU Profile 在最大線程測試中 30,000X 的最高得分超過 25,000,而 7980X 的最高得分約為 XNUMX。

9970X 與其 32 核前代 7970X 相比,也實現了相同的改進。例如,在 UL Procyon AI 推理測試中,它的得分從 187 躍升至 240;在 SPECworkstation 4 的生產力與開發套件中,它的領先優勢也相當顯著。 Geekbench 6 也展現了類似的表現,單核心和多核心得分都超越了先前的 32 核心和 64 核心型號,而 Blackmagic RAW 8K 解碼和 y-cruncher Pi 運算等實際測試也顯示出了持續的效能提升。最終,這些基準測試結果代表了其在 AI、渲染、壓縮和模擬任務方面的顯著提升。

最終,Threadripper 9980X 和 9970X 並非試圖重新定義高階桌面 CPU,而是以有意義的方式推動了架構的發展。 AMD 並未追求更高的核心數量或重大的平台變革,而是專注於提升 Zen 5 的效率、反應速度和處理實際工作負載的能力。最終,這兩款 CPU 有望提供更強大的單核心效能和更高的整體運算密度。因此,如果您在 HEDT 硬體上運行繁重的創意或科學工作負載(或者,即使您只是一位希望充分發揮高端設備性能的發燒友),那麼 9980X 和 9970X 都能帶來顯著的提升,即使沒有額外的核心,也值得升級。

產品頁面

參與 StorageReview

電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS訂閱

萊爾·史密斯

Lyle 是 StorageReview 的撰稿人,文章涵蓋了廣泛的終端使用者和企業 IT 主題。