Quadro RTX 4000, som tillkännagavs i november förra året, är en del av NVIDIAs professionella GPU-familj. RTX 4000 är speciellt designad för professionella CAD-programvaror, och ger intensiv realism och uppslukande interaktion med deras design. Detta gör att de kan köra avancerade simuleringar och analyser på sin lokala arbetsstation.
Quadro RTX 4000, som tillkännagavs i november förra året, är en del av NVIDIAs professionella GPU-familj. RTX 4000 är speciellt designad för professionella CAD-programvaror, och ger intensiv realism och uppslukande interaktion med deras design. Detta gör att de kan köra avancerade simuleringar och analyser på sin lokala arbetsstation.
Inte olikt andra NVIDIA GPU:er, använder RTX 4000 NVIDIA Quadro Scalable Visual Solutions (SVS). Som ett resultat kan varje enskilt RTX 4000-kort stödja upp till fyra 5K-skärmar vid 60Hz, eller dubbla 8K-skärmar. När du använder två Quadro Sync II-kort kan ett system stödja upp till åtta RTX 4000 GPU:er, vilket synkroniserar 32 separata skärmar. NVIDIA hävdar också en förbättring av bandbredden med 40 % jämfört med föregående generation Quadro P4000, delvis tack vare 8 GB GDDR6-grafikminne.
RTX 4000 har en 4.4” H x 9.5” L enkelslotsformfaktor, vilket gör att GPU:n passar en mängd olika arbetsstationschassier. I denna slimmade formfaktor kunde NVIDIA få plats med 2304 CUDA-kärnor, 288 Tensor-kärnor, 36 RT-kärnor och 8GB GDDR6-minne. Den här hårdvaran är designad för intensiva AEC-, DCC-, AI-, VR- och grafikbelastningar. RTX 4000 kommer med VirtualLink för att förenkla anslutningen till nästa generations högupplösta VR-huvudmonterade skärmar.
Quadro RTX 4000 specifikationer
arkitektur | NVIDIA Turing |
GPU-minne | 8GB GDDR6 |
Minnesgränssnitt | 256-bitars |
minnesbandbredd | Upp till 416 GB/s |
NVIDIA CUDA-kärnor | 2,304 |
NVIDIA Tensor Cores | 288 |
NVIDIA RT-kärnor | 36 |
Enkelprecisionsprestanda | 7.1 TFLOPS |
Tensorprestanda | 57.0 TFLOPS |
Systemgränssnitt | PCI Express 3.0 x 16 |
Energiförbrukning | Total korteffekt: 160W Total grafikeffekt: 125W Termisk lösning aktiv |
Formfaktor | 4.4" H x 9.5" L, enkel plats |
Max samtidiga visningar | 4x 3840×2160 @ 120 Hz 4x 5120×2880 @ 60 Hz 2x 7680×4320 @ 60 Hz |
VR Ready | Ja |
Grafik API:er | Shader Model 5.1 OpenGL 4.5 DirectX 12.0 Vulkan 1.0 |
Beräkna API:er | CUDA DirectCompute OpenCL |
Prestation
För att testa prestandan hos den nya arkitekturen i NVIDIA Quadro RTX 4000 GPU installerade vi den i vår Lenovo ThinkSystem P920-arbetsstation som kör Windows 10. För en heltäckande titt på hur varje kort presterar utnyttjade vi flera industririktmärken och GPU-accelererad programvara som kan dra full nytta av kortet som testas. Vi kommer inte bara att jämföra den med NVIDIA Quadro RTX 5000, som delar Turning-arkitekturen, vi kommer också att jämföra den med den tidigare Pascal Quadro-linjen inklusive P6000, den P5000, Och den P4000. Detta är mindre av, vilket är bättre, och mer av vad man kan förvänta sig med den valda GPU:n.
För att få en bättre uppfattning om hur dessa GPU:er har skalat från olika arkitekturer, har vi inkluderat följande tabell för RTX som den är idag. RTX 4000 är helt klart instegskortet i familjen, där korten i P-serien började med P1000. Naturligtvis skalar RTX-familjen hela vägen upp till RTX 8000, vilket ger mer grafikminne, bandbredd och kärnor längs vägen.
NVIDIA Quadro GPU:er | ||||
---|---|---|---|---|
RTX 4000 | RTX 5000 | RTX 6000 | RTX 8000 | |
GPU-minne | 8GB GDDR6 | 16GB GDDR6 | 24GB GDDR6 | 48GB GDDR6 |
Minnesgränssnitt | 256-bitars | 256-bitars | 384-bitars | 384-bitars |
minnesbandbredd | UPP till 416 GB/s | Upp till 448 GB/s | Upp till 672 GB/s | Upp till 672 GB/s |
NVIDIA CUDA-kärnor | 2,304 | 3,072 | 4,608 | 4,608 |
NVIDIA Tensor Cores | 288 | 384 | 576 | 576 |
NVIDIA RT-kärnor | 36 | 48 | 72 | 72 |
Enkelprecisionsprestanda | 7.1 TFLOPS | 11.2 TFLOPS | 16.3 TFLOPS | 16.3 TFLOPS |
Tensorprestanda | 57.0 TFLOPS | 89.2 TFLOPS | 130.5 TFLOPS | 130.5 TFLOPS |
Vårt första benchmark är LuxMarks plattformsoberoende OpenCL benchmark-verktyg. LuxMark är baserat på LuxCore API och erbjuds som en reklamkomponent i LuxCoreRender-sviten. Den använder en ny mikrokärnbaserad OpenCL-sökvägsspårare som rendering mer för sitt riktmärke, och erbjuder ett unikt sätt att betona den GPU som är installerad i en given arbetsstation.
LuxMark | |
---|---|
GPUs | Resultat |
P4000 | 15,303 |
P5000 | 13,170 |
P6000 | 21,297 |
RTX 4000 | 28,338 |
RTX 5000 | 29,404 |
Medan Pascal GPU:erna kom från LuxMark med bra resultat finns det ett uppenbart hopp i prestanda när man tittar på Turning GPU:erna. RTX 4000 kom på andra plats efter RTX 5000 med en poäng på 28,338 XNUMX.
Nästa upp är Arion, ett CUDA-benchmarking-verktyg, utvecklat av RandomControl som gör att arbetsstationer kan stressa CPU:er eller GPU:er i en renderingapplikation. ArionBench är ett mjukvaruverktyg baserat på Arion 2-teknik som sätter CPU/GPU:er under stor påfrestning genom uppgiften att simulera ljusflödet i en 3D-scen.
Arion | |
---|---|
GPUs | Resultat |
P4000 | 1,865 |
P5000 | 2,738 |
P6000 | 3,731 |
RTX 4000 | 4,484 |
RTX 5000 | 6,193 |
Ytterligare ett stort hopp i poäng från Pascal till Turing med RTX 4000 som gör ett ganska stort hopp över P6000.
Vårt nästa riktmärke utnyttjar SolidWorks 2019 och fyra 3D-modeller som täcker en Audi R8, en bygggrävare, en jetmotor samt en ralleybil. Solidworks är en branschledande GPU-accelererad 3D CAD-modelleringsprogram som fungerar på Windows-baserade system. SolidWorks är utvecklat av Dassault Systèmes och används av över två miljoner ingenjörer och mer än 165,000 2019 företag världen över. För benchmarkingsändamål använder vi den nya "performance pipeline"-funktionen i SolidWorks 4.5. Denna arkitektur ger en mer responsiv realtidsvisning speciellt för stora modeller. Den drar fördel av modern OpenGL (XNUMX) och hårdvaruaccelererad rendering för att bibehålla en hög detaljnivå och bildhastighet när du panorerar, zoomar eller roterar stora modeller.
Efter att varje modell har renderats roterar vårt skript varje modell fem gånger och mäter den tid som krävs för att slutföra denna uppgift. Den dividerar sedan det med antalet renderade bildrutor och beräknar den genomsnittliga poängen för bildrutor per sektion (FPS).
Solid | |
---|---|
Solidworks R8 | Genomsnitt |
P4000 | 198.0232 |
P5000 | 214.9254 |
P6000 | 217.9745 |
RTX 4000 | 211.1824 |
RTX 5000 | 208.8849 |
Solidworks grävare | Genomsnitt |
P4000 | 186.4832 |
P5000 | 211.9595 |
P6000 | 230.9774 |
RTX 4000 | 259.6056 |
RTX 5000 | 294.2529 |
Solidworks Jet Engine | Genomsnitt |
P4000 | 163.0573 |
P5000 | 198.5351 |
P6000 | 210.411 |
RTX 4000 | 220.6897 |
RTX 5000 | 283.2206 |
Solidworks rallybil | Genomsnitt |
P4000 | 205.6225 |
P5000 | 219.0114 |
P6000 | 218.4922 |
RTX 4000 | 214.4253 |
RTX 5000 | 217.256 |
Med Solidworks R8 och Rally Car är det en liten dipp i prestanda för Turing-modellerna, men det finns ett stort hopp i Digger och Jet Engine. Med våra Solidworks-tester använde vi beta-visningsläget som kan vara orsaken till den ovanliga skalningen som kan ses på Audi R8 och RallyCar Assemblies.
Nästa upp är riktmärket Environmental Systems Research Institute (Esri). Esri är en leverantör av programvara för Geographic Information System (GIS). Esris Performance Team designade sina PerfTool-tilläggsskript för att automatiskt starta ArcGIS Pro. Denna applikation använder en "ZoomToBookmarks"-funktion för att bläddra i olika fördefinierade bokmärken och skapa en loggfil med alla viktiga datapunkter som krävs för att förutsäga användarupplevelsen. Skriptet slingrar automatiskt bokmärkena tre gånger för att ta hänsyn till cachelagring (minne och diskcache). Med andra ord simulerar detta riktmärke tung grafisk användning som man kan se genom Esris ArcGIS Pro 2.3-programvara.
Testerna består av tre huvudsakliga datamängder. Två är 3-D stadsvyer över Philadelphia, PA och Montreal, QC. Dessa stadsvyer innehåller texturerade 3D-byggnader med flera patcher draperade på en terrängmodell och draperade flygbilder. Den tredje datamängden är en 2-D kartvy över Portland, OR-regionen. Dessa data innehåller detaljerad information om vägar, markanvändningsområden, parker och skolor, floder, sjöar och bergskuggad terräng.
Om man tittar på dragtid för Montreal-modellen, visade NVIDIA Quadro RTX 4000 en genomsnittlig dragtid på 00:01:31.284, medan genomsnittlig och lägsta FPS visade 502.395 respektive 180.699.
ESRI ArcGIS Pro 2.3 Montreal | |
---|---|
Ritningstid | Genomsnitt |
Quadro P4000 | 00:01:31.084 |
Quadro P5000 | 00: 01: 31: 082 |
Quadro P6000 | 00:01:31.081 |
Quadro RTX 4000 | 00:01:31.284 |
Quadro RTX 5000 | 00:01:31.067 |
Genomsnittlig FPS | Genomsnitt |
Quadro P4000 | 432.327 |
Quadro P5000 | 489.889 |
Quadro P6000 | 521.551 |
Quadro RTX 4000 | 502.395 |
Quadro RTX 5000 | 527.636 |
Minsta FPS | Genomsnitt |
Quadro P4000 | 164.546 |
Quadro P5000 | 194.218 |
Quadro P6000 | 190.336 |
Quadro RTX 4000 | 180.699 |
Quadro RTX 5000 | 190.775 |
Nästa upp är vår Philly-modell, där RTX 4000 visade en genomsnittlig dragtid på 00:01:00.231, medan genomsnittlig och lägsta FPS visade 434.170 respektive 196.825.
ESRI ArcGIS Pro 2.3 Philly | |
---|---|
Ritningstid | Genomsnitt |
Quadro P4000 | 00:02:53.928 |
Quadro P5000 | 00:01:01.109 |
Quadro P6000 | 00:01:01.245 |
Quadro RTX 4000 | 00:01:00.231 |
Quadro RTX 5000 | 00:01:01.111 |
Genomsnittlig FPS | Genomsnitt |
Quadro P4000 | 304.340 |
Quadro P5000 | 451.826 |
Quadro P6000 | 469.879 |
Quadro RTX 4000 | 434.170 |
Quadro RTX 5000 | 531.315 |
Minsta FPS | Genomsnitt |
Quadro P4000 | 160.152 |
Quadro P5000 | 212.910 |
Quadro P6000 | 207.879 |
Quadro RTX 4000 | 196.825 |
Quadro RTX 5000 | 224.341 |
Vår sista modell är från Portland. Här hade RTX 4000 en genomsnittlig dragtid på 00:00:32.646. Genomsnittlig FPS visade 2,821.928 medan Minimum FPS visade 1,083.260.
ESRI ArcGIS Pro 2.3 Portland | |
---|---|
Ritningstid | Genomsnitt |
Quadro P4000 | 00:00:32.426 |
Quadro P5000 | 00:00:32.310 |
Quadro P6000 | 00:00:32.552 |
Quadro RTX 4000 | 00:00:32.646 |
Quadro RTX 5000 | 00:00:32.541 |
Genomsnittlig FPS | Genomsnitt |
Quadro P4000 | 2,051.053 |
Quadro P5000 | 2,057.395 |
Quadro P6000 | 2,343.948 |
Quadro RTX 4000 | 2,821.928 |
Quadro RTX 5000 | 2,783.547 |
Minsta FPS | Genomsnitt |
Quadro P4000 | 1,179.974 |
Quadro P5000 | 1,189.524 |
Quadro P6000 | 1,282.045 |
Quadro RTX 4000 | 1,083.260 |
Quadro RTX 5000 | 1,007.309 |
Slutsats
NVIDIA Quadro RTX 4000 är en Turing-arkitektur GPU på lägre nivå men det betyder inte att den inte är kraftfull. RTX 4000 är utrustad med 2304 CUDA-kärnor och 8 GB GDDR6 GPU. Liksom alla andra Quadro RTX kan 4000 leverera accelererad strålspårning, djupinlärning och avancerad skuggning i sin lättillgängliga formfaktor med enstaka spår. Detta kan ge kreativa proffs snabbare tid till insikt samtidigt som de kan påskynda sina kreativa ansträngningar. RTX 4000 kommer också med VirtualLink som förenklar anslutningen till nästa generations högupplösta VR-huvudmonterade skärmar.
När det gäller prestanda presterade RTX 4000 mycket bra, särskilt med tanke på att den ligger i den nedre delen av de nya GPU:erna. I vårt LuxMark-riktmärke fördubblade den nästan sin Pascal-motsvarighet och överträffade till och med P6000. I Arion mer än fördubblade RTX 4000 P4000 och överträffade återigen enkelt P6000. I våra Solidworks-riktmärken överträffade RTX 4000 enkelt P4000 och lyste starkare i Digger- och Jet Engine-riktmärket. I ESRi hade RTX 4000 mycket bättre prestanda än P4000 (och P5000 i vissa fall), men det finns arbetsbelastningar där P6000 presterade bättre. Man bör komma ihåg att RTX 4000 är i den lägre delen av Turing-arkitekturen och P6000 är i den högsta delen av Pascal-arkitekturen.
Sammantaget är Quadro RTX 4000 ett mycket välkommet tillägg till NVIDIAs stora serie av imponerande grafikprocessorer och erbjuder mycket imponerande prestandasiffror för instegskortet samtidigt som den bär en prislapp på endast cirka 900 $.
Anmäl dig till StorageReviews nyhetsbrev