Hem konsumentenKundtillbehör NVIDIA Quadro RTX 4000 recension

NVIDIA Quadro RTX 4000 recension

by StorageReview Consumer Desk

Quadro RTX 4000, som tillkännagavs i november förra året, är en del av NVIDIAs professionella GPU-familj. RTX 4000 är speciellt designad för professionella CAD-programvaror, och ger intensiv realism och uppslukande interaktion med deras design. Detta gör att de kan köra avancerade simuleringar och analyser på sin lokala arbetsstation.


Quadro RTX 4000, som tillkännagavs i november förra året, är en del av NVIDIAs professionella GPU-familj. RTX 4000 är speciellt designad för professionella CAD-programvaror, och ger intensiv realism och uppslukande interaktion med deras design. Detta gör att de kan köra avancerade simuleringar och analyser på sin lokala arbetsstation.

Inte olikt andra NVIDIA GPU:er, använder RTX 4000 NVIDIA Quadro Scalable Visual Solutions (SVS). Som ett resultat kan varje enskilt RTX 4000-kort stödja upp till fyra 5K-skärmar vid 60Hz, eller dubbla 8K-skärmar. När du använder två Quadro Sync II-kort kan ett system stödja upp till åtta RTX 4000 GPU:er, vilket synkroniserar 32 separata skärmar. NVIDIA hävdar också en förbättring av bandbredden med 40 % jämfört med föregående generation Quadro P4000, delvis tack vare 8 GB GDDR6-grafikminne.

RTX 4000 har en 4.4” H x 9.5” L enkelslotsformfaktor, vilket gör att GPU:n passar en mängd olika arbetsstationschassier. I denna slimmade formfaktor kunde NVIDIA få plats med 2304 CUDA-kärnor, 288 Tensor-kärnor, 36 RT-kärnor och 8GB GDDR6-minne. Den här hårdvaran är designad för intensiva AEC-, DCC-, AI-, VR- och grafikbelastningar. RTX 4000 kommer med VirtualLink för att förenkla anslutningen till nästa generations högupplösta VR-huvudmonterade skärmar.

Quadro RTX 4000 specifikationer

arkitektur NVIDIA Turing
GPU-minne 8GB GDDR6
Minnesgränssnitt 256-bitars
minnesbandbredd Upp till 416 GB/s
NVIDIA CUDA-kärnor 2,304
NVIDIA Tensor Cores 288
NVIDIA RT-kärnor 36
Enkelprecisionsprestanda 7.1 TFLOPS
Tensorprestanda 57.0 TFLOPS
Systemgränssnitt PCI Express 3.0 x 16
Energiförbrukning Total korteffekt: 160W
Total grafikeffekt: 125W
Termisk lösning aktiv
Formfaktor 4.4" H x 9.5" L, enkel plats
Max samtidiga visningar 4x 3840×2160 @ 120 Hz
4x 5120×2880 @ 60 Hz
2x 7680×4320 @ 60 Hz
VR Ready Ja
Grafik API:er Shader Model 5.1
OpenGL 4.5
DirectX 12.0
Vulkan 1.0
Beräkna API:er CUDA
DirectCompute
OpenCL

Prestation

För att testa prestandan hos den nya arkitekturen i NVIDIA Quadro RTX 4000 GPU installerade vi den i vår Lenovo ThinkSystem P920-arbetsstation som kör Windows 10. För en heltäckande titt på hur varje kort presterar utnyttjade vi flera industririktmärken och GPU-accelererad programvara som kan dra full nytta av kortet som testas. Vi kommer inte bara att jämföra den med NVIDIA Quadro RTX 5000, som delar Turning-arkitekturen, vi kommer också att jämföra den med den tidigare Pascal Quadro-linjen inklusive P6000, den P5000, Och den P4000. Detta är mindre av, vilket är bättre, och mer av vad man kan förvänta sig med den valda GPU:n.

För att få en bättre uppfattning om hur dessa GPU:er har skalat från olika arkitekturer, har vi inkluderat följande tabell för RTX som den är idag. RTX 4000 är helt klart instegskortet i familjen, där korten i P-serien började med P1000. Naturligtvis skalar RTX-familjen hela vägen upp till RTX 8000, vilket ger mer grafikminne, bandbredd och kärnor längs vägen.

NVIDIA Quadro GPU:er
RTX 4000 RTX 5000 RTX 6000 RTX 8000
GPU-minne 8GB GDDR6 16GB GDDR6 24GB GDDR6 48GB GDDR6
Minnesgränssnitt 256-bitars 256-bitars 384-bitars 384-bitars
minnesbandbredd UPP till 416 GB/s Upp till 448 GB/s Upp till 672 GB/s Upp till 672 GB/s
NVIDIA CUDA-kärnor 2,304 3,072 4,608 4,608
NVIDIA Tensor Cores 288 384 576 576
NVIDIA RT-kärnor 36 48 72 72
Enkelprecisionsprestanda 7.1 TFLOPS 11.2 TFLOPS 16.3 TFLOPS 16.3 TFLOPS
Tensorprestanda 57.0 TFLOPS  89.2 TFLOPS 130.5 TFLOPS 130.5 TFLOPS

Vårt första benchmark är LuxMarks plattformsoberoende OpenCL benchmark-verktyg. LuxMark är baserat på LuxCore API och erbjuds som en reklamkomponent i LuxCoreRender-sviten. Den använder en ny mikrokärnbaserad OpenCL-sökvägsspårare som rendering mer för sitt riktmärke, och erbjuder ett unikt sätt att betona den GPU som är installerad i en given arbetsstation.

LuxMark
GPUs Resultat
P4000 15,303
P5000 13,170
P6000 21,297
RTX 4000 28,338
RTX 5000 29,404

Medan Pascal GPU:erna kom från LuxMark med bra resultat finns det ett uppenbart hopp i prestanda när man tittar på Turning GPU:erna. RTX 4000 kom på andra plats efter RTX 5000 med en poäng på 28,338 XNUMX.

Nästa upp är Arion, ett CUDA-benchmarking-verktyg, utvecklat av RandomControl som gör att arbetsstationer kan stressa CPU:er eller GPU:er i en renderingapplikation. ArionBench är ett mjukvaruverktyg baserat på Arion 2-teknik som sätter CPU/GPU:er under stor påfrestning genom uppgiften att simulera ljusflödet i en 3D-scen.

Arion
GPUs Resultat
P4000 1,865
P5000 2,738
P6000 3,731
RTX 4000 4,484
RTX 5000 6,193

Ytterligare ett stort hopp i poäng från Pascal till Turing med RTX 4000 som gör ett ganska stort hopp över P6000.

Vårt nästa riktmärke utnyttjar SolidWorks 2019 och fyra 3D-modeller som täcker en Audi R8, en bygggrävare, en jetmotor samt en ralleybil. Solidworks är en branschledande GPU-accelererad 3D CAD-modelleringsprogram som fungerar på Windows-baserade system. SolidWorks är utvecklat av Dassault Systèmes och används av över två miljoner ingenjörer och mer än 165,000 2019 företag världen över. För benchmarkingsändamål använder vi den nya "performance pipeline"-funktionen i SolidWorks 4.5. Denna arkitektur ger en mer responsiv realtidsvisning speciellt för stora modeller. Den drar fördel av modern OpenGL (XNUMX) och hårdvaruaccelererad rendering för att bibehålla en hög detaljnivå och bildhastighet när du panorerar, zoomar eller roterar stora modeller.

Efter att varje modell har renderats roterar vårt skript varje modell fem gånger och mäter den tid som krävs för att slutföra denna uppgift. Den dividerar sedan det med antalet renderade bildrutor och beräknar den genomsnittliga poängen för bildrutor per sektion (FPS).

Solid
Solidworks R8 Genomsnitt
P4000 198.0232
P5000 214.9254
P6000 217.9745
RTX 4000 211.1824
RTX 5000 208.8849
Solidworks grävare Genomsnitt
P4000 186.4832
P5000 211.9595
P6000 230.9774
RTX 4000 259.6056
RTX 5000 294.2529
Solidworks Jet Engine Genomsnitt
P4000 163.0573
P5000 198.5351
P6000 210.411
RTX 4000 220.6897
RTX 5000 283.2206
Solidworks rallybil Genomsnitt
P4000 205.6225
P5000 219.0114
P6000 218.4922
RTX 4000 214.4253
RTX 5000 217.256

Med Solidworks R8 och Rally Car är det en liten dipp i prestanda för Turing-modellerna, men det finns ett stort hopp i Digger och Jet Engine. Med våra Solidworks-tester använde vi beta-visningsläget som kan vara orsaken till den ovanliga skalningen som kan ses på Audi R8 och RallyCar Assemblies.

Nästa upp är riktmärket Environmental Systems Research Institute (Esri). Esri är en leverantör av programvara för Geographic Information System (GIS). Esris Performance Team designade sina PerfTool-tilläggsskript för att automatiskt starta ArcGIS Pro. Denna applikation använder en "ZoomToBookmarks"-funktion för att bläddra i olika fördefinierade bokmärken och skapa en loggfil med alla viktiga datapunkter som krävs för att förutsäga användarupplevelsen. Skriptet slingrar automatiskt bokmärkena tre gånger för att ta hänsyn till cachelagring (minne och diskcache). Med andra ord simulerar detta riktmärke tung grafisk användning som man kan se genom Esris ArcGIS Pro 2.3-programvara.

Testerna består av tre huvudsakliga datamängder. Två är 3-D stadsvyer över Philadelphia, PA och Montreal, QC. Dessa stadsvyer innehåller texturerade 3D-byggnader med flera patcher draperade på en terrängmodell och draperade flygbilder. Den tredje datamängden är en 2-D kartvy över Portland, OR-regionen. Dessa data innehåller detaljerad information om vägar, markanvändningsområden, parker och skolor, floder, sjöar och bergskuggad terräng.

Om man tittar på dragtid för Montreal-modellen, visade NVIDIA Quadro RTX 4000 en genomsnittlig dragtid på 00:01:31.284, medan genomsnittlig och lägsta FPS visade 502.395 respektive 180.699.

ESRI ArcGIS Pro 2.3 Montreal
Ritningstid Genomsnitt
Quadro P4000 00:01:31.084
Quadro P5000 00: 01: 31: 082
Quadro P6000 00:01:31.081
Quadro RTX 4000 00:01:31.284
Quadro RTX 5000 00:01:31.067
Genomsnittlig FPS Genomsnitt
Quadro P4000 432.327
Quadro P5000 489.889
Quadro P6000 521.551
Quadro RTX 4000 502.395
Quadro RTX 5000 527.636
Minsta FPS Genomsnitt
Quadro P4000 164.546
Quadro P5000 194.218
Quadro P6000 190.336
Quadro RTX 4000 180.699
Quadro RTX 5000 190.775

Nästa upp är vår Philly-modell, där RTX 4000 visade en genomsnittlig dragtid på 00:01:00.231, medan genomsnittlig och lägsta FPS visade 434.170 respektive 196.825.

ESRI ArcGIS Pro 2.3 Philly
Ritningstid Genomsnitt
Quadro P4000 00:02:53.928
Quadro P5000 00:01:01.109
Quadro P6000 00:01:01.245
Quadro RTX 4000 00:01:00.231
Quadro RTX 5000 00:01:01.111
Genomsnittlig FPS Genomsnitt
Quadro P4000 304.340
Quadro P5000 451.826
Quadro P6000 469.879
Quadro RTX 4000 434.170
Quadro RTX 5000 531.315
Minsta FPS Genomsnitt
Quadro P4000 160.152
Quadro P5000 212.910
Quadro P6000 207.879
Quadro RTX 4000 196.825
Quadro RTX 5000 224.341

Vår sista modell är från Portland. Här hade RTX 4000 en genomsnittlig dragtid på 00:00:32.646. Genomsnittlig FPS visade 2,821.928 medan Minimum FPS visade 1,083.260.

ESRI ArcGIS Pro 2.3 Portland
Ritningstid Genomsnitt
Quadro P4000 00:00:32.426
Quadro P5000 00:00:32.310
Quadro P6000 00:00:32.552
Quadro RTX 4000 00:00:32.646
Quadro RTX 5000 00:00:32.541
Genomsnittlig FPS Genomsnitt
Quadro P4000 2,051.053
Quadro P5000 2,057.395
Quadro P6000 2,343.948
Quadro RTX 4000 2,821.928
Quadro RTX 5000 2,783.547
Minsta FPS Genomsnitt
Quadro P4000 1,179.974
Quadro P5000 1,189.524
Quadro P6000 1,282.045
Quadro RTX 4000 1,083.260
Quadro RTX 5000 1,007.309

Slutsats

NVIDIA Quadro RTX 4000 är en Turing-arkitektur GPU på lägre nivå men det betyder inte att den inte är kraftfull. RTX 4000 är utrustad med 2304 CUDA-kärnor och 8 GB GDDR6 GPU. Liksom alla andra Quadro RTX kan 4000 leverera accelererad strålspårning, djupinlärning och avancerad skuggning i sin lättillgängliga formfaktor med enstaka spår. Detta kan ge kreativa proffs snabbare tid till insikt samtidigt som de kan påskynda sina kreativa ansträngningar. RTX 4000 kommer också med VirtualLink som förenklar anslutningen till nästa generations högupplösta VR-huvudmonterade skärmar.

När det gäller prestanda presterade RTX 4000 mycket bra, särskilt med tanke på att den ligger i den nedre delen av de nya GPU:erna. I vårt LuxMark-riktmärke fördubblade den nästan sin Pascal-motsvarighet och överträffade till och med P6000. I Arion mer än fördubblade RTX 4000 P4000 och överträffade återigen enkelt P6000. I våra Solidworks-riktmärken överträffade RTX 4000 enkelt P4000 och lyste starkare i Digger- och Jet Engine-riktmärket. I ESRi hade RTX 4000 mycket bättre prestanda än P4000 (och P5000 i vissa fall), men det finns arbetsbelastningar där P6000 presterade bättre. Man bör komma ihåg att RTX 4000 är i den lägre delen av Turing-arkitekturen och P6000 är i den högsta delen av Pascal-arkitekturen.

Sammantaget är Quadro RTX 4000 ett mycket välkommet tillägg till NVIDIAs stora serie av imponerande grafikprocessorer och erbjuder mycket imponerande prestandasiffror för instegskortet samtidigt som den bär en prislapp på endast cirka 900 $.

Quadro RTX 4000 på Amazon

Quadro RTX 4000 produktsida

Diskutera denna recension

Anmäl dig till StorageReviews nyhetsbrev