首頁 消費者客戶端配件 NVIDIA GeForce RTX 3090 與 Quadro RTX 8000 創意專業評測

NVIDIA GeForce RTX 3090 與 Quadro RTX 8000 創意專業評測

by 文斯·卡內維爾
NVIDIA RTX 3090

NVIDIA 新推出的基於 Ampere 的 GPU 現已上市,如果幸運的話,您實際上可能會購買一個。 截至 2021 年 3 月撰寫本文時,新 GPU 的庫存仍然極為稀缺,預計至少要到今年第三季度才能恢復正常。 但是,如果您無法為工作站配備全新的 NVIDIA GeForce RTX 3090,您真的會錯過這麼多嗎? 當然,如果您需要升級,有很多因素需要了解。

NVIDIA 新推出的基於 Ampere 的 GPU 現已上市,如果幸運的話,您實際上可能會購買一個。 截至 2021 年 3 月撰寫本文時,新 GPU 的庫存仍然極為稀缺,預計至少要到今年第三季度才能恢復正常。 但是,如果您無法為工作站配備全新的 NVIDIA GeForce RTX 3090,您真的會錯過這麼多嗎? 當然,如果您需要升級,有很多因素需要了解。

NVIDIA RTX 3090

今天,我們將看看一系列用例,以闡明等待是否值得。 我們將研究創造性的專業用例,例如 Blender、Davinci Resolve 和 LuxMark,但我們還將研究基於 Python 中的開源 TensorFlow 庫的機器學習基準測試,以及一些遊戲好措施。 我們將 NVIDIA GeForce RTX 3090 Founder's Edition 與 NVIDIA Quadro RTX 8000(前)NVIDIA 工作站產品線之王進行比較。 雖然更適合與 Quadro RTX 6000 進行比較,因為兩張卡都有 24GB 顯存,但結果幾乎相同,因為 8000 和 6000 的實際計算能力相同,而且這些基準測試都沒有使用超過 24GB顯存。 我們還有幾個 OEM 工作站用於比較,包括 我們之前評測過的聯想 P920 雙 RTX 8000s 和一個新的 聯想P620的 配備 AMD 最新的 Threadripper PRO。

為什麼我們要將工作站 Quadro 卡與消費級 GeForce 卡進行比較? 因為 NVIDIA 以前從未推出過如此強大的消費卡,而且與 Quadro 系列相比,花費三分之一的錢的價值主張變得非常誘人。 特別是因為在撰寫本文時,還沒有關於真正的 TITAN RTX 繼任者的官方消息,傳統上填補了工作和娛樂 GPU 的空缺。 現在也不能忽視世界的現狀,在家工作的解決方案是很多人的首要任務,擁有一個極其強大的 GPU 白天用於 CAD 和晚上玩遊戲聽起來比以往任何時候都好。 我們知道,我們可以通過屏幕聽到您關於“真正的”工作站卡的差異! 我們會到達那裡,我們保證; 繼續閱讀。

主要測試系統和GPU規格如下,包括驅動和BIOS版本。

OS Windows 10 專業版(20H2 版,2020 年 XNUMX 月)
中央處理器 AMD Ryzen 9 3900X
記憶體應用 4x8GB (32GB) G.Skill TridentZ Neo 3600MHz CL16
試駕 2TB 三星 970 Pro
主機板 華擎 X570 太極 (BIOS v4.00, PCIe Gen4)
圖形處理器 1 NVIDIA RTX 3090 創始人版(Studio Driver 461.40)
圖形處理器 2 NVIDIA Quadro RTX 8000(產科驅動R460 U3,461.40)

 

四核RTX 8000 RTX 3090 鐵
卓越的建築 圖靈 (12nm) 安培 (8nm)
CUDA核心 4,608 10,496
張量核心 576(第二代) 328(第三代)
RT核心 72(第一代) 82(第二代)
GPU內存 48GB GDDR6 帶 ECC 24GB GDDR6X
FP32 性能 16.3 TFLOPS 35.6 TFLOPS
電源消耗功率 295W 350W
PCIe 接口 PCIe 3.0 x16 PCIe 4.0 x16
冷卻器 鼓風機式 流通式
NVLink 多 GPU 支持 可以 可以
SR-IOV 支持 可以 沒有

GeForce RTX 3090 與 Quadro RTX 8000 基準測試

讓我們從遊戲開始。 在有關工作站圖形的文章中包含這似乎是一件奇怪的事情,但如今有這麼多人在家工作,期望許多專業人士在同一台機器上完成他們的工作並開始遊戲並不是沒有道理的。 我們測試了 Cyber​​punk 2077、Shadow of the Tomb Raider 和 Borderlands 3。Borderlands 和 Tomb Raider 有內置的基準測試工具,而 Cyber​​punk 沒有,我們覺得我們能夠在兩張卡之間記錄大量數據以給一個平均值。 所有測試均在 1440p 下完成; Borderlands 被設置為所有最大設置,除了運動模糊; 古墓麗影設置為全最大、RTX Ultra 且無 DLSS; Cyber​​punk 2077 設置為 RTX Medium Preset,DLSS 設置為 Quality。 像英雄聯盟和 CS:GO 這樣的電子競技遊戲使用這些卡中的任何一個都可以輕鬆保持超過 250 FPS,因此它們沒有經過全面測試。 有趣的是,我們在《使命召喚:戰區》中看到兩張卡始終超過 150 FPS,但沒有對其進行足夠徹底的測試以將其視為包含在此圖表中的真正基準。

rtx 3090 rtx 8000 遊戲

毫無疑問,RTX 3090 是目前市場上絕對最好的遊戲 GPU,雖然 AMD Radeon 6900XT 在某些遊戲中將與它一較高下,但在光線追踪方面,3090 沒有競爭對手. 賽博朋克 2077,不管你喜歡還是討厭,它是目前最苛刻的遊戲,在我們所有的測試中,RTX 3090 保持至少 65 FPS,即使在非常擁擠的場景中,大多數時候 FPS 都處於高位70 年代和低 80 年代,幀時間始終很短。 可以肯定地說,任何要求較低的東西都可以輕鬆地以最大設置運行並保持高幀率。 另請記住,這些測試是在 2021 年 2 月完成的,當時 NVIDIA 發布了對 GeForce 卡的可調整大小的 BAR 支持。 這種 PCIe 標准在 AMD 的新卡上作為智能存取內存銷售,將允許 CPU 立即直接訪問整個 VRAM 並提高遊戲性能。 早期結果顯示 FPS 提高 5%-XNUMX%,具體取決於遊戲。 可調整大小的 BAR 可能不會提高計算任務的性能,因此可能不會很快出現在 Quadro 產品線中。

這裡更有趣的結果是 Quadro RTX 8000 是多麼強大的遊戲卡。 雖然考慮到它的原始功能它似乎並不令人驚訝,但它的設計和驅動程序根本沒有針對遊戲進行優化,但在除了 Cyber​​punk 2077 之外的所有遊戲中,它都保持超過 60 FPS。 Cyber​​punk 充其量是起伏不定的,但調迴光線追踪並將 DLSS 設置為 Performance 大大改善了結果,在除要求最苛刻的場景外的所有場景中都保持超過 60 FPS。 值得注意的是,在 Quadro 上運行賽博朋克時,我們確實遇到了很多與光線追踪相關的錯誤,尤其是反射會完全消失並且場景會變暗的問題。 這在 RTX 3090 上沒有發生,所以我們將其歸結為與 Quadro 驅動程序和賽博朋克臭名昭著的漏洞有關的問題。

GeForce RTX 3090 上的古墓麗影之影,1440p,RTX 開啟,DLSS 關閉。

接下來是好東西; 您期望看到的工作站結果。 這批基準測試將關注 3D 建模、照明和視頻工作的性能。 我們將從 LuxMark 開始,這是一個 OpenCL GPU 基準測試實用程序。 我們使用了最新版本 v4alpha0,以及帶有經典 LuxBall 的舊版 v3。

RTX 3090 RTX 8000 勒克斯馬克

說 RTX 3090 具有令人印象深刻的性能是輕描淡寫的說法。 在嚴重依賴 GPU 的應用程序中,新的 Ampere 架構真正發揮了它的作用,甚至擊敗了聯想 P920 及其雙 RTX 8000。 在 LuxMark v3 中,性能翻了一番以上,而 v4 基準測試性能接近 150%。 期待看到更多類似這樣的圖表,但(劇透警告)並非所有內容都像看起來那樣清晰。

接下來,讓我們來看看來自 Chaos Group 的 V-Ray。 該基準測試適用於 V-Ray 3D 渲染和模擬工具集,它可作為各種 3D 建模應用程序的插件使用,例如 Cinema 4D、Maya、Rhino 和 Unreal 等。 該基準測試特別關注 CUDA 和 RTX 性能。 我們使用了最新版本的 V-Ray 基準測試 (v5) 和舊版本 (v4),僅用於比較。

RTX 3090 RTX 8000 V 射線

這裡的故事與 LuxMark 非常相似,RTX 3090 的性能大大優於 RTX 8000,甚至超過了聯想 P920 及其雙 GPU。 這個基準讓我們看到了 NVIDIA 對其第二代光線追踪核心所做的巨大改進; CUDA性能提升約一倍,RTX性能提升近2%。

接下來是無處不在的 Blender,這是一款開源 3D 建模應用程序。 該基準測試是使用 Blender Benchmark 實用程序運行的。 NVIDIA OptiX 是選擇的渲染方法,而不是 CUDA,因為所有這些系統都可以使用 RTX。

故事又一次大同小異,下一代 RTX 內核可以快速處理 Blender 渲染,甚至可以在 10 秒內燒毀 BMW 渲染。 這個故事還在繼續,但別擔心,它很快就會變得非常有趣。 在這裡,我們看看 OctaneBench,它是 OctaneRender 的基準測試實用程序,OctaneRender 是另一個支持 RTX 的 3D 渲染器,類似於 V-Ray。

是的。 接下來,我們將看看視頻編輯應用程序,特別是 Davinci Resolve Studio 16.2.8 和 Adob​​e Premiere Pro 2020。我們將使用 PugetBench for Adob​​e CC 和 PugetBench for Resolve,它們均由 普吉系統,一家為特定應用程序製造專業工作站的 PC 製造商。 這張圖專門看整體基準的GPU分數,在GPU加速效果上給性能打分。

最後,我們有一些價值主張有所下降的用例。 Premiere Pro 和 Davinci Resolve 等應用程序的性能需求因項目和效果而異,而且它們通常會遇到 CPU 瓶頸。 有一個改進,特別是在具有更好 GPU 優化的 Resolve 中,但 Adob​​e Creative Cloud 套件的用戶會發現低端 GeForce 卡(如 RTX 3080)的更多價值,在那裡你可以獲得 90 的表面上 46% 的性能價格的百分比(基於 Founder's Edition 卡的廠商建議零售價)。 雖然此處未報告,但 After Effects 和 Photoshop 中的性能相似,其中大多數測試都受 CPU 限制。 同樣值得注意的是,Quadro 和 GeForce 卡都使用第 7 代版本的 NVENC(NVIDIA 編碼器),因此 H.264 和 HEVC 渲染時間將相似。 請記住,GeForce 卡僅限於 3 個同時編碼任務(例如流媒體和錄製),而 Quadros 則沒有這樣的限制。 我們知道繞過此限制,但我們稍後會解決這個問題。 RTX 3090 確實使用了新一代 NVDEC(NVIDIA 解碼器),因此在處理 HEVC 和 H.264 素材時,時間線擦除方面會有邊際改進。

讓我們從創意應用轉向新事物。 我們將使用恰當地命名為 AI-Benchmark 的基準來查看這些卡的機器學習性能。 它是一個開源 Python 庫,使用 TensorFlow 機器學習庫運行一系列深度學習測試。 你可以找到更多相關信息 點擊這裡 以及它使用的具體測試方法。

RTX 3090 RTX 8000 人工智能

聽到了你們集體的喘息聲。 這與大多數創意基準測試的情況相同,GeForce 卡表面上是 Quadro 性能的兩倍。 此測試是在 Windows 10 中完成的,但您可以在您選擇的 Linux 發行版中獲得類似的結果。 在測試時,TensorFlow 尚未更新以支持新的 Ampere 卡,但通過一些 hackery,我們能夠通過混合和匹配不同 CUDA 開發工具包的組件使其運行。 我們希望將來適當更新版本只會改善結果。

最後但同樣重要的是,我們將看看 SPECviewperf 2020,它是標準性能評估公司對行業標準基準測試實用程序的最新修訂版。 該基準測試著眼於各種專業應用程序中的圖形性能。 我們還包括了配備較舊 Quadro P620 的聯想 P6000 以供比較。

存儲回顧-NVIDIA-RTX-3090-SpecviewPerf

這就是事情變得有趣的地方。 3D 建模結果與您的預期相符,RTX 3090 的性能明顯優於 RTX 8000,但 CATIA 和 Creo 等應用程序以及能源和醫療測試實際上 3090 的性能略有下降,但意義重大利潤。 在我們的聯想 P6000 中,它的表現甚至不如顯著較舊的 Quadro P620。 但是西門子 NX 呢? 這是工作站與消費者、Quadro 與 GeForce 之間困境的癥結所在。 您正在正確閱讀該圖表; 3090 在西門子 NX 中得分為 25.37。 我們跑了七次這個測試並參考了互聯網上的其他基準測試結果,這個結果是絕對正確的。 在此測試中,RTX 3090 的性能不到聯想 P5 與 RTX 620 的 8000%。 讓我們在下一節中對此進行更多探討。

工作站與消費者 GPU; 司機們

不可否認,GeForce RTX 3090 是一款非常強大的 GPU,而 Quadro RTX 8000 也是一款功能強大的 GPU,但它們的不同之處很重要。 RTX 3090 首先是一款遊戲顯卡。 它的設計和銷售是作為絕對最佳的遊戲 GPU 和“世界上第一款支持 8K 的”遊戲卡。 事實上,它可以在眾多任務中勝過 RTX 8000,在大多數情況下都具有極高的利潤率,這證明了它的原始能力,本質上是蠻力通過這些測試的。 Quadro RTX 8000 首先是一款工作站卡,設計用於放置在工作站中,擠在機架式服務器中,通過 NVLink 連接在一起,虛擬化,努力運行並保持濕潤(當然是比喻)並生存。

RTX 3090 RTX 8000 第 2 組

那麼這就引出了一個問題,為什麼 GeForce RTX 3090 在某些任務上的表現不如使用了 3 年的 Quadro RTX 8000,甚至還不如使用了將近 6 年的 Quadro P6000? 具體來說,為什麼 RTX 8000 比西門子 NX 性能高一個數量級? 精明的讀者,我們相信您已經知道; 它歸結為驅動程序優化。 在哪些 GPU 獲得工作站優化方面,NVIDIA 是法官、陪審團和劊子手,很明顯,他們不希望 RTX 3090 能夠在每個應用程序中完全抹殺他們之前的 Quadro 系列。 許多潛在買家會非常失望地看到他們希望白天擁有頂級工作站性能,而晚上卻不可能玩高端遊戲,至少在 RTX 3090 的建議零售價 1,499 美元的情況下是這樣。 “嗯,這就是 TITAN 系列的用途,”我們聽到您說,但目前沒有可用的 TITAN RTX 替代品,而且 3090 的定價無疑將其定位為 TITAN 替代品。 NVIDIA 甚至在其營銷材料的第一行中吹噓 3090 具有“TITAN 級性能”,但西門子 NX 的結果遠不及“TITAN 級”。 3090 只是過度建造、定價過高的 3080 嗎? 好吧,不完全是。 它仍然是適用於 3D 建模者和視頻工作的最佳 GPU,尤其是其 24GB 的顯存允許創意人員輕鬆處理大型模型和 8K 素材,但這使其處於相當小的利基市場,之前由 TITAN 服務的利基市場-類卡片。 如果您不使用西門子 NX、Creo 或 CATIA 等 CAD 應用程序,那麼 RTX 3090 仍然很有吸引力,但如果這些應用程序對您的工作流程至關重要,那麼它絕對不能入手。

還有其他的考慮。 雖然 Quadro 和 GeForce 卡都通過 NVLink 提供多 GPU 設置,值得注意的是在 3090 系列卡中只有 3000 具有此功能,但只有 Quadro 可以使用 SR-IOV 進行虛擬化。 如果您的工作負載涉及將一個 GPU 或兩個 NVLinked GPU 分配給多個 VM,Quadro 仍然是您唯一的選擇。 雖然有很多方法可以解決這個問題,但問題仍然存在,即此功能受到 NVIDIA 的 GeForce 驅動程序的人為限制。 順便說一句,同一個驅動程序確實為一些創意應用程序提供認證,如 Adob​​e 套件和 Autodesk,以及在其 Studio 變體中的 WHQL(Windows 硬件質量實驗室)認證,進一步混淆了這一點。 雖然我們預計未來 NVIDIA 將推出真正基於安培的 TITAN 替代品,但對 GeForce RTX 3090 施加的人為限制(包括使用 NVENC 進行並發編碼的限制)感覺與專業用戶目前正在尋找的東西脫節.

在撰寫本文時,NVIDIA 還宣布了他們新的加密貨幣挖礦專用 GPU 系列,並打算將即將推出的 RTX 3060 的挖礦性能降低一半。加密挖礦性能的下降完全是人為的,完全是通過驅動程序完成的,進一步說明了這一點無論 NVIDIA 認為我們的顯卡值得做什麼,我們都只能任其擺佈。 3060 的這個“無法破解”的限制會被利用嗎? 毫無疑問,NVENC 限制已被打破。 但就目前而言,NVIDIA 手握所有底牌,對於大量針對 CUDA、RTX、TensorFlow 和其他 NVIDIA 特定計算平台進行高度優化的專業工作流程,除了 NVIDIA 之外別無選擇。

結論

讓我們分解一下。 您是否應該為 RTX 3090 保持庫存提醒? 勇敢地在您當地的 MicroCenter 外面排長隊,以獲得獲得一個的機會? 與大多數事情一樣,答案是“視情況而定”。

  • 您是專門在 Blender 和 Cinema 3D 等應用程序中處理大型 4D 模型,還是經常編輯大型 6K 和 8K 視頻文件? 好的; RTX 3090 是市場上用於 CUDA 和 RTX 加速工作流程的最佳創意專業 GPU。
  • 您是否有足夠的可支配收入來購買絕對不妥協的遊戲裝備? 也是的; RTX 3090 是金錢可以買到的最好的遊戲 GPU,尤其是在支持光線追踪和 DLSS 2.0 的遊戲中,這個列表每天都在增加。
  • 您是否主要從事 CAD 工作,尤其是在使用 Creo 和 CATIA 等應用程序的科學領域? 那就不要; RTX 3090 不提供 Quadro 系列卡附帶的必要驅動程序優化,再多的強力原始功率也無法克服這一點。 我們正在努力獲得新的 RTX-A6000,RTX 8000s 的實際替代品,以幫助告知像您這樣的人。
  • 你在機器學習和人工智能領域工作嗎? 這是一個好壞參半的包,因為 TensorFlow 的性能非常好,它看起來像是“是”,但不幸的是,沒有足夠的標準化測試或數據點來得出與更新的 Quadro 卡相比的明確結論。 此外,在撰寫本文時,TensorFlow 尚未更新以正確支持安培卡。 我們目前的回答是肯定的。 我們可以看看 MLCommons 和 MLperf 在未來作為後續行動,專門針對 AI 和機器學習用例。
  • 您目前是否擁有 TITAN RTX 並希望升級? 我們建議您等待 NVIDIA 關於基於 Ampere 的 TITAN 的官方聲明,據傳最終會發布。 如果您的用例充分利用了 TITAN,RTX 3090 可能最終會降級,具體取決於您的工作流程。
  • 你做了很多 GPU 虛擬化嗎? 這是一個堅定的否定; RTX 3090 本身不支持 SR-IOV。

考慮到所有這些,我們希望這可以告知您是否升級的決定,以及您是選擇 GeForce 還是 Quadro。 如果 RTX 1,499 的 3090 美元建議零售價對您的血液來說太豐富,並且您不需要超過 10GB 的 VRAM,那麼 RTX 3080 也是一個不錯的選擇。 雖然未在此處進行明確測試,但我們發現我們的結果通常比基於網絡結果的 RTX 20 好 30%-3080%,因此您可以預期它在類似應用程序中優於(或低於)Quadro RTX 8000。 等待傳聞中的 RTX 3080 Ti 可能也是值得的,無論何時,它都可以作為中間立場。 目前,我們將密切關注基於 Ampere 的 TITAN 能否真正填補完整工作站卡和完整遊戲卡之間的空白。 我們還將密切關注 NVIDIA 的驅動程序管道,看看它們是否會在未來的版本中緩解該卡的任何與工作相關的缺點,但我們對此表示懷疑。 我們很想听聽您對此的想法,如果我們遺漏了您希望看到的任何基准或用例,尤其是與人工智能和機器學習有關的。 在我們的社交渠道上與我們聯繫,並繼續關注更多有創意的專業和工作站評論。

閱讀更多 - NVIDIA RTX A6000 評測

亞馬遜上的 NVIDIA Quadro RTX 8000

亞馬遜上的 NVIDIA GeForce RTX 3090 創始人版

參與 StorageReview

電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS訂閱