홈페이지 소비자클라이언트 액세서리 NVIDIA Quadro RTX 5000 검토

NVIDIA Quadro RTX 5000 검토

by 아담 암스트롱

지난 5000월 SIGGRAPH에서 NVIDIA는 완전히 새로운 그래픽 아키텍처인 Turing과 새로운 Quadro RTX GPU를 발표했습니다. 당시 발표된 몇 가지 새로운 GPU 중에서 오늘 우리는 NVIDIA Quadro RTX 5000 GPU를 구체적으로 살펴볼 것입니다. 딥 러닝 및 고급 셰이딩도 사용하는 최초의 레이 트레이싱 GPU로 청구됩니다. RTX XNUMX은 사실적인 장면을 실시간으로 렌더링할 수 있는 잠재력이 있는 차세대 워크로드를 위해 설계되었으며, 비디오 편집자는 물론 자동차 및 건축 디자이너에게도 큰 도움이 됩니다.


지난 5000월 SIGGRAPH에서 NVIDIA는 완전히 새로운 그래픽 아키텍처인 Turing과 새로운 Quadro RTX GPU를 발표했습니다. 당시 발표된 몇 가지 새로운 GPU 중에서 오늘 우리는 NVIDIA Quadro RTX 5000 GPU를 구체적으로 살펴볼 것입니다. 딥 러닝 및 고급 셰이딩도 사용하는 최초의 레이 트레이싱 GPU로 청구됩니다. RTX XNUMX은 사실적인 장면을 실시간으로 렌더링할 수 있는 잠재력이 있는 차세대 워크로드를 위해 설계되었으며, 비디오 편집자는 물론 자동차 및 건축 디자이너에게도 큰 도움이 됩니다.

새로운 GPU 물결의 원동력은 NVIDIA의 새로운 Turing 아키텍처입니다. 이 회사는 GPU 리더십으로 존경받고 있으며 이를 기반으로 새로운 핵심 GPU 아키텍처를 구축했습니다. 아키텍처의 주제는 여기에 들어가기에는 너무 심오하지만 요약하자면 Turing은 몇 가지 하드웨어 발전을 사용하여 인상적인 새로운 결과를 얻습니다. 광선 추적을 위해 아키텍처는 3D 환경에서 빛과 소리가 초당 최대 10Giga Rays로 이동하는 방식의 계산을 가속화하는 RT 코어라는 프로세서를 활용합니다. 스트리밍 멀티프로세서는 래스터 성능을 향상시키고 향상된 그래픽 파이프라인과 프로그래밍 가능한 새로운 음영 기술을 추가합니다. Turing은 초당 500조 텐서 작업을 제공하는 새로운 텐서 코어와 함께 제공됩니다. Turing을 통해 사용자는 더 많은 CUDA 코어를 활용하여 초당 16조 정수 연산과 동시에 최대 16조 부동 소수점 연산을 지원할 수 있습니다.

NVIDIA Quadro RTX 5000은 복잡한 프로젝트를 빠르고 효과적으로 수행해야 하는 크리에이티브 전문가를 위해 설계되었습니다. GPU에는 3,072개의 CUDA 코어, 384개의 Tensor 코어, 48개의 RT 코어 및 16GB GDDR6 메모리가 있습니다. 이 인상적인 하드웨어는 물리적으로 정확한 그림자, 반사 및 굴절을 사용하여 복잡한 모델과 장면을 렌더링할 수 있습니다. RTX 5000은 사용자가 여러 GPU 구성으로 메모리와 성능을 확장할 수 있도록 NVIDIA NVLink를 지원합니다. 워크스테이션에 공간이 있다고 가정하면 사용자는 최대 5000GB/s의 대역폭과 결합된 50GB의 GDDR32 메모리를 위해 6개의 Quadro RTX XNUMX GPU를 연결할 수 있습니다. GPU는 또한 차세대 고해상도 VR 머리 장착형 디스플레이에 대한 연결을 제공하는 VirtualLink와 함께 제공됩니다.

NVIDIA Quadro RTX 5000 사양

아키텍처 엔비디아 튜링
GPU 메모리 16GB GDDR6
메모리 인터페이스 256-bit
메모리 대역폭 최대 448GB/s
ECC 가능
NVIDIA CUDA 코어 3,072
NVIDIA 텐서 코어 384
NVIDIA RT 코어 48
단정밀도 성능 11.2 TFLOPS
텐서 성능 89.2 TFLOPS
엔비디아 NV링크 2개의 Quadro RTX 5000 GPU 연결
NVIDIA NVLink 대역폭 50GB/s(양방향)
시스템 인터페이스 PCI 익스프레스 3.0 x 16
전력 소비 총 보드 전력: 265W
총 그래픽 전력: 230W
열 솔루션 활성
폼 팩터 4.4" H x 10.5" L, 이중 슬롯, 전체 높이
디스플레이 커넥터 4xDP 1.4, 1x USB-C
최대 동시 디스플레이 4x 4096×2160 @ 120Hz
4x 5120×2880 @ 60Hz
2x 7680×4320 @ 60Hz
인코딩/디코드 엔진 1X 인코딩, 2X 디코드
VR 준비 가능
그래픽 API 다이렉트 12.0
셰이더 모델 5.1
OpenGL 4.5
불칸 1.0
컴퓨팅 API
CUDA
다이렉트컴퓨트
OpenCL

퍼포먼스

NVIDIA Quadro RTX 5000 GPU에서 새로운 아키텍처의 성능을 테스트하기 위해 Windows 920을 실행하는 Lenovo ThinkSystem P10 워크스테이션에 설치했습니다. 각 카드의 성능을 종합적으로 살펴보기 위해 여러 업계 벤치마크와 GPU 가속을 활용했습니다. 테스트 중인 카드를 최대한 활용할 수 있는 소프트웨어입니다. Turning 아키텍처를 공유하는 NVIDIA Quadro RTX 4000과 비교할 뿐만 아니라 P6000Walk Through California 프로그램, P5000및 P4000. 이것은 더 적고, 더 낫고, 선택한 GPU에서 기대할 수 있는 것입니다.

이러한 GPU가 다양한 아키텍처에서 어떻게 확장되었는지 더 잘 이해할 수 있도록 현재 RTX 제품군을 요약한 다음 표를 포함했습니다. RTX 5000은 엔트리급 RTX 4000에서 한 단계 위, 두 개의 더 강력한 RTX 6000 및 RTX 8000 형제 아래에 있는 중간 슬롯에 있습니다.

엔비디아 쿼드로 GPU
RTX 4000 RTX 5000 RTX 6000 RTX 8000
GPU 메모리 8GB GDDR6 16GB GDDR6 24GB GDDR6 48GB GDDR6
메모리 인터페이스 256-bit 256-bit 384-bit 384-bit
메모리 대역폭 최대 416GB/s 최대 448GB/s 최대 672GB/s 최대 672GB/s
NVIDIA CUDA 코어 2,304 3,072 4,608 4,608
NVIDIA 텐서 코어 288 384  576 576
NVIDIA RT 코어 36 48 72 72
단정밀도 성능 7.1 TFLOPS 11.2 TFLOPS 16.3 TFLOPS 16.3 TFLOPS
텐서 성능 57.0 TFLOPS 89.2 TFLOPS 130.5 TFLOPS 130.5 TFLOPS

첫 번째 벤치마크는 LuxMark 크로스 플랫폼 OpenCL 벤치마크 도구입니다. LuxMark는 LuxCore API를 기반으로 하며 LuxCoreRender 제품군의 프로모션 구성 요소로 제공됩니다. 벤치마크를 위한 추가 렌더링으로 새로운 마이크로 커널 기반 OpenCL 경로 추적기를 사용하여 주어진 워크스테이션에 설치된 GPU에 스트레스를 주는 독특한 방법을 제공합니다.

럭스마크
GPU 결과
P4000 15,303
P5000 13,170
P6000 21,297
RTX 4000 28,338
RTX 5000 29,404

Pascal GPU가 LuxMark에서 좋은 결과를 얻었지만 Turning GPU를 보면 성능이 확연히 향상되었습니다. RTX 5000은 29,404점으로 놀라울 정도로 최고의 성능을 보였습니다.

다음은 RandomControl에서 개발한 CUDA 벤치마킹 도구인 Arion으로 워크스테이션이 렌더링 응용 프로그램에서 CPU 또는 GPU에 스트레스를 줄 수 있습니다. ArionBench는 2D 장면에서 빛의 흐름을 시뮬레이션하는 작업을 통해 CPU/GPU에 과도한 스트레스를 주는 Arion 3 기술 기반 소프트웨어 도구입니다.

아리온
GPU 결과
P4000 1,865
P5000 2,738
P6000 3,731
RTX 4000 4,484
RTX 5000 6,193

RTX 5000이 P6000보다 훨씬 더 빠른 속도로 나머지 제품보다 앞서 나가면서 Pascal에서 Turing으로 가는 또 다른 큰 점수 점프입니다.

우리의 다음 벤치마크는 SolidWorks 2019와 Audi R3, 건설 굴착기, 제트 엔진 및 랠리카를 포함하는 8개의 3D 모델을 활용합니다. Solidworks는 Windows 기반 시스템에서 작동하는 업계 최고의 GPU 가속 165,000D CAD 모델링 응용 프로그램입니다. SolidWorks는 Dassault Systèmes에서 개발했으며 전 세계적으로 2019만 명 이상의 엔지니어와 4.5개 이상의 회사에서 사용하고 있습니다. 벤치마킹을 위해 SolidWorks XNUMX 내부의 새로운 "성능 파이프라인" 기능을 활용합니다. 이 아키텍처는 특히 대형 모델에 대해 보다 반응이 빠른 실시간 디스플레이를 제공합니다. 최신 OpenGL(XNUMX) 및 하드웨어 가속 렌더링을 활용하여 대형 모델을 이동, 확대/축소 또는 회전할 때 높은 수준의 세부 정보와 프레임 속도를 유지합니다.

각 모델이 렌더링된 후 스크립트는 각 모델을 XNUMX번 회전하고 이 작업을 완료하는 데 필요한 시간을 측정합니다. 그런 다음 이를 렌더링된 프레임 수로 나누고 섹션당 평균 프레임 수(FPS) 점수를 계산합니다.

SolidWorks
솔리드웍스 R8 평균 FPS
P4000 198.0232
P5000 214.9254
P6000 217.9745
RTX 4000 211.1824
RTX 5000 208.8849
솔리드웍스 파는 사람 평균 FPS
P4000 186.4832
P5000 211.9595
P6000 230.9774
RTX 4000 259.6056
RTX 5000 294.2529
솔리드웍스 제트 엔진 평균 FPS
P4000 163.0573
P5000 198.5351
P6000 210.411
RTX 4000 220.6897
RTX 5000 283.2206
솔리드웍스 랠리카 평균 FPS
P4000 205.6225
P5000 219.0114
P6000 218.4922
RTX 4000 214.4253
RTX 5000 217.256

파스칼에 비해 Solidworks R8 및 Rally Car의 Turing GPU 성능이 약간 저하되는 것은 흥미롭지만 이러한 파일은 최신 GPU를 완전히 활용하지 못할 수 있습니다. RTX 5000은 Digger 및 Jet Engine에서 뛰어난 성능을 제공하여 다른 제품보다 큰 차이를 보였습니다. Solidworks에서 우리는 Audi R8 및 RallyCar 어셈블리에서 볼 수 있는 비정상적인 스케일링의 원인이 될 수 있는 베타 디스플레이 모드를 사용하고 있었습니다.

다음은 환경 시스템 연구소(Esri) 벤치마크입니다. Esri는 지리 정보 시스템(GIS) 소프트웨어 공급업체입니다. Esri의 성능 팀은 ArcGIS Pro를 자동으로 실행하도록 PerfTool 애드인 스크립트를 설계했습니다. 이 애플리케이션은 "ZoomToBookmarks" 기능을 사용하여 미리 정의된 다양한 북마크를 찾아보고 사용자 경험을 예측하는 데 필요한 모든 주요 데이터 포인트가 포함된 로그 파일을 생성합니다. 스크립트는 캐싱(메모리 및 디스크 캐시)을 고려하여 책갈피를 자동으로 세 번 반복합니다. 즉, 이 벤치마크는 Esri의 ArcGIS Pro 2.3 소프트웨어를 통해 볼 수 있는 과도한 그래픽 사용을 시뮬레이션합니다.

테스트는 세 가지 주요 데이터 세트로 구성됩니다. 두 개는 펜실베이니아주 필라델피아와 QC주 몬트리올의 3D 도시 전망입니다. 이러한 도시 보기에는 지형 모델에 드리워진 질감이 있는 3D 멀티패치 건물과 드리워진 항공 이미지가 포함되어 있습니다. 세 번째 데이터 세트는 OR 지역의 Portland에 대한 2D 지도 보기입니다. 이 데이터에는 도로, 토지 사용 구획, 공원 및 학교, 강, 호수 및 그늘진 지형에 대한 자세한 정보가 포함되어 있습니다.

몬트리올 모델의 드로우타임을 보면 엔비디아 쿼드로 RTX 5000의 평균 드로우타임은 00:01:31.067로 평균 FPS는 527.636, 최소 FPS는 190.775를 나타냈다.

ESRI ArcGIS Pro 2.3 몬트리올
드로우타임 평균
쿼드로 P4000 00:01:31.084
쿼드로 P5000 00 : 01 : 31 : 082
쿼드로 P6000 00:01:31.081
쿼드로 RTX 4000 00:01:31.284
쿼드로 RTX 5000 00:01:31.067
평균 FPS 평균
쿼드로 P4000 432.327
쿼드로 P5000 489.889
쿼드로 P6000 521.551
쿼드로 RTX 4000 502.395
쿼드로 RTX 5000 527.636
최소 FPS 평균
쿼드로 P4000 164.546
쿼드로 P5000 194.218
쿼드로 P6000 190.336
쿼드로 RTX 4000 180.699
쿼드로 RTX 5000 190.775

다음은 Philly 모델로 RTX 5000의 평균 드로우 타임은 00:01:01.111, 평균 및 최소 FPS는 각각 531.315 및 224.341입니다.

ESRI ArcGIS Pro 2.3 필라델피아
드로우타임 평균
쿼드로 P4000 00:02:53.928
쿼드로 P5000 00:01:01.109
쿼드로 P6000 00:01:01.245
쿼드로 RTX 4000 00:01:00.231
쿼드로 RTX 5000 00:01:01.111
평균 FPS 평균
쿼드로 P4000 304.340
쿼드로 P5000 451.826
쿼드로 P6000 469.879
쿼드로 RTX 4000 434.170
쿼드로 RTX 5000 531.315
최소 FPS 평균
쿼드로 P4000 160.152
쿼드로 P5000 212.910
쿼드로 P6000 207.879
쿼드로 RTX 4000 196.825
쿼드로 RTX 5000 224.341

마지막 모델은 포틀랜드입니다. 여기서 RTX 5000의 평균 드로우타임은 00:00:32.541이었습니다. 평균 FPS는 2,783.547, 최소 FPS는 1,007.309를 나타냈습니다.

ESRI ArcGIS Pro 2.3 포틀랜드
드로우타임 평균
쿼드로 P4000 00:00:32.426
쿼드로 P5000 00:00:32.310
쿼드로 P6000 00:00:32.552
쿼드로 RTX 4000 00:00:32.646
쿼드로 RTX 5000 00:00:32.541
평균 FPS 평균
쿼드로 P4000 2,051.053
쿼드로 P5000 2,057.395
쿼드로 P6000 2,343.948
쿼드로 RTX 4000 2,821.928
쿼드로 RTX 5000 2,783.547
최소 FPS 평균
쿼드로 P4000 1,179.974
쿼드로 P5000 1,189.524
쿼드로 P6000 1,282.045
쿼드로 RTX 4000 1,083.260
쿼드로 RTX 5000 1,007.309

결론

NVIDIA Quadro RTX 5000은 Turing 아키텍처를 기반으로 하는 회사의 최신 GPU 중 하나입니다. Turing은 GPU 아키텍처에 대한 완전히 새로운 테이크가 될 것입니다. NVIDIA는 미래의 개발을 염두에 두고 두 가지를 모두 변경하려고 합니다. 효율적이고 빠른 작업이 필요한 복잡한 프로젝트가 있는 창의적인 전문가를 대상으로 하는 RTX 5000은 3,072개의 CUDA 코어, 384개의 Tensor 코어, 48개의 RT 코어 및 16GB GDDR6 메모리를 포함한 인상적인 하드웨어를 갖추고 있습니다. 훨씬 더 높은 GPU 성능이 필요한 사용자를 위해 RTX는 NVIDIA NVLink를 통해 두 번째 GPU로 확장할 수 있습니다.

우수한 성능을 이끌어 내야 하는 모든 구성 요소에 대해 우리는 그것이 무엇을 할 수 있는지 알아보기 위해 새롭고 오래된 테스트를 거쳤습니다. 놀랍게도 NVIDIA Quadro RTX 5000은 대부분의 테스트에서 최고의 성능을 보였습니다. LuxMark와 Arion에서 RTX 5000은 P5000 점수의 두 배 이상이었습니다. RTX 5000은 Solidworks Digger 및 Jet Engine 벤치마크에서 강력한 성능을 보였습니다. RTX 5000은 그만큼 강력하지만 Turing GPU의 최상위 라인은 아니라는 점을 명심해야 합니다.

크리에이티브 전문가가 대부분의 영역에서 더 큰 성능 도약을 찾고 있다면 NVIDIA Quadro RTX 5000이 적합할 것입니다. 위의 성능 결과는 RTX 5000이 빛나는 영역과 Pascal 기반 GPU가 충분히 잘 작동하는 몇 가지 지점을 강조합니다. 전반적으로 NVIDIA는 RTX 제품군을 통해 데스크탑 내에서 크리에이티브가 사용할 수 있는 것의 한계를 지속적으로 확장하는 데 탁월한 성과를 거두었습니다. 그 부분에서 RTX 5000은 미드레인지 제품을 잘 채우고 성능과 가격의 적절한 균형을 제공합니다.

Amazon의 NVIDIA RTX 5000

이 리뷰에 대해 토론하기

StorageReview 뉴스레터 신청