NVIDIA RTX A6000은 10,752세대 RTX 아키텍처를 활용하는 회사의 최신 릴리스입니다. 84개의 CUDA 처리 코어와 6000개의 차세대 RT 코어를 결합한 새로운 GPU는 실시간 광선 추적 및 전문적인 최종 프레임 광선 추적 출력 모두에서 최고 수준의 성능을 제공합니다. NVIDIA는 RTX A6000을 RTX 8000의 후속 제품으로 간주하지만 본질적으로 RTX XNUMX을 직접 대체합니다.
NVIDIA RTX A6000은 10,752세대 RTX 아키텍처를 활용하는 회사의 최신 릴리스입니다. 84개의 CUDA 처리 코어와 6000개의 차세대 RT 코어를 결합한 새로운 GPU는 실시간 광선 추적 및 전문적인 최종 프레임 광선 추적 출력 모두에서 최고 수준의 성능을 제공합니다. NVIDIA는 RTX A6000을 RTX XNUMX의 후속 제품으로 간주하지만 본질적으로 RTX 8000.
RTX 8000은 이 리뷰를 기준으로 약 3년이 되었기 때문에 마침내 NVIDIA의 이전 동급 최고의 워크스테이션 GPU를 대체하는 것을 보게 되어 기쁩니다. 이 회사는 최근 전문 솔루션을 식별하기 위해 Quadro라는 이름을 사용하는 것을 중단했습니다. 그러나 RTX A6000은 여전히 Quadro 라인과 동일한 모든 전문 기능, 하드웨어 및 소프트웨어 인증, 인증 드라이버를 갖추고 있습니다.
NVIDIA RTX A6000 대 RTX 6000 대 RTX 8000
RTX A6000은 어떤 최신 카드와 비교해도 엄청난 업그레이드로, 움직이는 물체의 보다 사실적인 출력과 하드웨어 가속 모션 블러 지원을 제공합니다(후자는 렌더링 시 최종 이미지의 전반적인 현실감을 개선하는 데 사용됨). 움직이는 물체). 또한 가속화된 AI 노이즈 제거 기능을 제공합니다. 이는 더 적은 수의 렌더링 패스를 사용하여 더 높은 품질의 출력을 의미하므로 렌더링 시간이 더 빨라집니다. 또한 A6000은 PCIe Gen4 표준을 지원하는 NVIDIA 최초의 전문가용 그래픽 카드입니다.
새로운 NVIDIA 카드는 RTX 6000의 메모리 크기를 48GB의 GDDR6(RTX 8000과 동일)로 두 배로 늘려 더 큰 3D 데이터 세트로 작업할 수 있도록 합니다. 이것은 또한 크리에이티브 전문가가 장면 복잡성을 줄이지 않고도 큰 3D 장면을 렌더링할 수 있음을 의미합니다. 예산이 더 많고 48GB 이상의 메모리가 필요한 워크로드가 있는 전문가의 경우 NVIDIA NVLink를 통해 6000개의 A96 카드를 연결하여 XNUMXGB의 통합 GPU 메모리를 사용할 수 있습니다.
아마도 RTX A6000의 가장 중요한 업그레이드는 엔비디아 암페어, 8억 개의 트랜지스터를 특징으로 하는 삼성의 28nm NVIDIA 맞춤형 프로세스를 사용하는 새로운 아키텍처입니다. 아래 성능 차트에서 볼 수 있듯이 이 새로운 아키텍처는 대부분의 테스트에서 RTX 6000을 물 밖으로 날려버릴 것입니다.
다른 Ampere 하이라이트는 다음과 같습니다.
- 개선된 스트리밍 멀티프로세서
- 레이 트레이싱 하드웨어 가속을 향상시키는 XNUMX세대 레이 트레이싱 코어
- AI 추론 성능과 DLSS를 개선하여 더 높은 해상도에서 더 나은 성능을 제공하는 XNUMX세대 Tensor 코어
Ampere 아키텍처는 또한 이전 세대 모델에 비해 단정밀도 부동 소수점을 최대 3배까지 CUDA 코어를 증가시킵니다. 이는 XNUMXD 모델 개발 및 컴퓨터 지원 엔지니어링을 위한 데스크탑 시뮬레이션과 같은 계산과 같은 영역에서 눈에 띄는 성능 향상을 의미합니다.
NVIDIA RTX A6000 대 RTX 3090
예, RTX A6000은 RTX 8000을 직접 대체하고 기술적으로는 RTX 6000의 후속 제품이지만 실제로 사양과 잠재적인 성능 출력에 관한 한 여러 면에서 RTX 3090과 더 유사합니다. 두 카드 모두 새로운 Ampere(8nm) 아키텍처를 활용하며 유사한 CUDA 및 RT 코어 수를 제공합니다.
두 카드 간의 성능 차이는 RTX 3090의 향상된 드라이버 최적화와 최신 RAM(3090의 GDDR6X 대 A6000의 GDDR6) 때문일 수 있습니다. 그럼에도 불구하고 RTX A6000은 NVIDIA의 대규모 릴리스이며 특정 영역에서 시장에 나와 있는 다른 어떤 카드보다 훨씬 뛰어난 성능을 발휘할 것입니다.
NVIDIA RTX A6000 사양
GPU | RTX-A6000 |
아키텍처 | 암페어 |
주조 | 삼성 |
프로세스 크기 | 8nm |
트랜지스터 | 28.3 억 |
다이 크기 | 628.4 mm2 |
CUDA 병렬 처리 코어 | 10,752 |
NVIDIA 텐서 코어 | 336 |
NVIDIA RT 코어 | 84 |
GPU 메모리 | 48GB GDDR6(ECC 포함) |
메모리 인터페이스 | 384-bit |
메모리 대역폭 | 768 GB / 초 |
최대 소비 전력 | 300W |
그래픽 버스 | PCI 익스프레스 4.0 x16 |
디스플레이 커넥터 | DP 1.4(4) |
폼 팩터 | 4.4" H x 10.5" L 듀얼 슬롯 |
제품 무게 | 1.179의 kg |
열 솔루션 | 최근활동 |
vGPU 소프트웨어 지원 | NVIDIA GRID, NVIDIA Quadro 가상 데이터 센터 워크스테이션, NVIDIA 가상 컴퓨팅 서버 |
지원되는 vGPU 프로필 | 1GB, 2GB, 3GB, 4GB, 6GB, 8GB,
12GB, 16GB, 24GB, 48GB |
NVIDIA® 3D Vision® 및 3D Vision Pro | 3핀 미니 DIN을 통한 지원 |
프레임 잠금 | 호환 가능(Quadro Sync II 사용) |
NVLink | 2웨이 로우 프로파일(2슬롯 및 3슬롯 브리지)
2x RTX A6000 연결 |
NVLink 상호 연결 | 112.5GB/s(양방향) |
전원 커넥터 | 1x 8핀 CPU |
엔벤씨 | NVDEC | 1x | 2x(+AV1 디코드) |
퍼포먼스
성능을 측정하기 위해 RTX A6000을 일련의 리소스 집약적 테스트를 통해 RTX 8000 및 RTX 3090 FE와 비교했습니다. 두 곳 모두에 RTX A6000을 설치했습니다. HP Z센트럴 4R 그리고 P620 워크스테이션, RTX 8000은 일부 벤치마크에서도 사용했습니다.
HP Z센트럴 4R:
- Intel Xeon 2295(3.0GHz 기본 주파수, Intel vPro 기술 사용 시 최대 4.6GHz)
- 64GB DDR4-2933 ECC SDRAM
- 1TB M.2 SSD
레노버 씽크스테이션 P620:
- AMD Ryzen Threadripper Pro 3995WX 프로세서(2.70GHz, 최대 4.20GHz 최대 부스트, 64코어, 128스레드, 32MB 캐시)
- DDR64 RAM의 4GB
- 1TB PM981 SSD
Blender 및 LuxMark 테스트를 위해 맞춤형 소비자 빌드에 RTX 8000 및 RTX 3090을 설치했습니다.
- AMD Ryzen 9 3900X
- 4GB(8GB) 32개 G.Skill TridentZ Neo 3600MHz CL16
- 2TB 삼성 970 프로
- ASRock X570 Taichi(BIOS v4.00, PCIe Gen4)
SPECviewperf 2020
첫 번째는 OpenGL 및 Direct X 애플리케이션 프로그래밍 인터페이스에서 실행되는 전문 애플리케이션의 그래픽 성능을 측정하기 위한 세계적인 표준인 SPECviewperf 2020 벤치마크입니다. 뷰 세트(또는 벤치마크)는 애플리케이션 자체를 설치할 필요 없이 실제 애플리케이션의 그래픽 콘텐츠 및 동작을 나타냅니다. 이러한 뷰 세트에는 3D Max, CATIA, Creo, Energy, Maya, Medical, Siemens NX 및 Solidworks가 포함됩니다.
주의 사항: 이 테스트에 4K 해상도(3800 x 2120)를 사용했으며 둘 다 HP ZCentral 4R에 설치되었습니다.
뷰셋 | 엔비디아 RTX A6000 Lenovo ThinkStation P620 |
엔비디아 RTX A6000 HP Z센트럴 4R |
엔비디아 RTX 8000 Lenovo ThinkStation P620 |
3dsmax-07 | 131.96 | 127.89 | 110.01 |
카티아-06 | 90.99 | 75.32 | 69.37 |
크레오-03 | 125.88 | 99.54 | 108.11 |
에너지-03 | 42.22 | 38.83 | 27.11 |
마야-06 | 314.82 | 273.01 | 238.84 |
의료-03 | 34.87 | 30.58 | 27.67 |
Snx-04 | 450.72 | 422.01 | 375.83 |
SW-05 | 161.4 | 152.19 | 136.5 |
이 벤치마크에서 RTX A6000은 특히 Siemens NX 범주에서 두 워크스테이션 내부의 이전 세대 모델에 비해 극적인 개선을 보여주었습니다. 앞에서 언급했듯이 Ampere 아키텍처는 성능 면에서 엄청난 도약이므로 이는 확실히 예상되었으며 나머지 벤치마크에서도 이러한 성능 추세가 계속되는 것을 볼 수 있습니다.
다음으로 우리는 워크스테이션 성능의 모든 주요 측면을 테스트하기 위해 설계된 벤치마크를 전문으로 하는 테스트인 SPECworkstation3를 실행했습니다. 30개 이상의 워크로드를 사용하여 CPU, 그래픽, I/O 및 메모리 대역폭을 테스트합니다. 워크로드는 미디어 및 엔터테인먼트, 금융 서비스, 제품 개발, 에너지, 생명 과학 및 일반 운영과 같은 더 넓은 범주로 나뉩니다. 개별 워크로드가 아닌 각각에 대한 광범위한 범주 결과를 나열할 것입니다. 결과는 각 범주의 모든 개별 워크로드의 평균입니다.
SPEC워크스테이션3
카테고리 | 엔비디아 RTX A6000 Lenovo ThinkStation P620 |
엔비디아 RTX A6000 HP Z센트럴 4R |
엔비디아 RTX 8000 Lenovo ThinkStation P620 |
나를 | 6.04 | 3.49 | 3.82 |
ProdDev | 5.49 | 3.63 | 3.97 |
생명과학 | 4.61 | 3.76 | 4.07 |
에너지 | 5.58 | 2.79 | 완료하지 못했습니다 |
FSI | 9.49 | 3.38 | 4.08 |
일반 작전 | 2.14 | 1.63 | 2.1 |
GPU 컴퓨팅 | 7.44 | 7.22 | 5.88 |
전반적으로 우리는 P620 내부에 설치했을 때 대부분의 범주에서 또 다른 상당한 성능 향상을 보았으며, 때로는 RTX 8000보다 두 배 이상의 결과를 보였습니다. HP ZCentral 워크스테이션 내부에 채워졌을 때 GPU 컴퓨팅을 제외하고 더 낮은 수치를 보였습니다. .
환경시스템연구소(Esri)
다음은 환경 시스템 연구소(Esri) 벤치마크입니다. Esri는 GIS(지리 정보 시스템) 소프트웨어 공급업체이며 성능 팀은 ArcGIS Pro를 자동으로 시작하도록 PerfTool 애드인 스크립트를 설계했습니다.
이 애플리케이션은 "ZoomToBookmarks" 기능을 사용하여 사전 정의된 다양한 북마크를 탐색하고 사용자 경험을 예측하는 데 필요한 모든 주요 데이터 포인트가 포함된 로그 파일을 생성합니다. 스크립트는 캐싱(메모리 및 디스크 캐시)을 고려하여 책갈피를 자동으로 세 번 반복합니다. 즉, 이 벤치마크는 Esri의 ArcGIS Pro 소프트웨어를 통해 볼 수 있는 과도한 그래픽 사용을 시뮬레이션합니다.
테스트는 세 가지 주요 데이터 세트로 구성됩니다. 두 개는 펜실베이니아주 필라델피아와 QC주 몬트리올의 3D 도시 전망입니다. 이러한 도시 보기에는 지형 모델에 드리워진 질감이 있는 3D 멀티패치 건물과 드리워진 항공 이미지가 포함되어 있습니다. 세 번째 데이터 세트는 OR 지역의 Portland에 대한 2D 지도 보기입니다. 이 데이터에는 도로, 토지 사용 구획, 공원 및 학교, 강, 호수 및 언덕 음영 지형에 대한 자세한 정보가 포함되어 있습니다.
먼저 몬트리올입니다. 여기에서 RTX A6000은 평균 FPS 614.03과 최소 FPS 238.18을 기록했습니다.
ESRI ArcGIS Pro 2.3 몬트리올 | |
평균 FPS |
|
엔비디아 RTX 8000 | 471.58 |
엔비디아 RTX A6000 | 614.03 |
최소 FPS | |
엔비디아 RTX 8000 | 220.36 |
엔비디아 RTX A6000 | 238.18 |
다음은 RTX A6000이 평균 FPS 542.70, 최소 FPS 237.54를 기록한 Philly입니다.
ESRI ArcGIS Pro 2.3 필라델피아 | |
평균 FPS |
|
엔비디아 RTX 8000 | 509.31 |
엔비디아 RTX A6000 | 542.70 |
최소 FPS |
|
엔비디아 RTX 8000 | 271.01 |
엔비디아 RTX A6000 | 237.54 |
마지막 모델은 포틀랜드입니다. 여기에서 RTX A6000은 평균 FPS가 2,756.82, 최소 FPS가 906.17이었습니다.
ESRI ArcGIS Pro 2.3 포틀랜드 | |
평균 FPS |
|
엔비디아 RTX 8000 | 2,270.52 |
엔비디아 RTX A6000 | 2,756.82 |
최소 FPS |
|
엔비디아 RTX 8000 | 965.13 |
엔비디아 RTX A6000 | 906.17 |
믹서기
다음은 오픈 소스 3D 모델링 애플리케이션인 유비쿼터스 Blender입니다. 이 벤치마크는 Blender Benchmark 유틸리티를 사용하여 실행되었습니다. NVIDIA OptiX는 A6000 및 유사 제품이 RTX를 활용할 수 있기 때문에 CUDA와 달리 렌더링 방법으로 선택되었습니다. 초 단위로 측정된 이 벤치마크에서는 낮을수록 좋습니다.
A6000은 HP와 Lenovo 워크스테이션 모두에서 RTX 8000에 비해 모든 범주(Koro 제외)에서 큰 향상을 보였습니다. 모든 범주에서 RTX 3090을 뒤졌지만 RTX A6000은 게임용 GPU에 돈을 벌었습니다.
럭스마크
LuxMark는 오픈 소스 3D 렌더링 엔진인 LuxRender를 유지 관리하는 사람들이 제공하는 OpenCL 교차 플랫폼 벤치마킹 도구입니다. 이 도구는 3D 모델링, 조명 및 비디오 작업 영역에서 GPU 성능을 살펴봅니다. 이 리뷰에서는 최신 버전인 v4alpha0을 사용했습니다. LuxMark에서는 점수가 높을수록 좋습니다.
음식 렌더링 부문에서 RTX A6000은 레노버 P8,088 내부에서 620점을 기록해 RTX 8000(3,337점)보다 3090배 이상 높았고, RTX 8,929(20,983점)보다 약간 뒤처졌다. Hallbench 렌더링 범주에서 새로운 NVIDIA 카드는 9,794개(vs. 3090)로 이전 세대 카드의 두 배 이상이며 RTX 23,555의 4개를 뒤쫓고 있습니다. HP ZCentral 6000R 내부에서 RTX A7,123은 음식 및 Hallbench 범주에서 각각 20,246점과 XNUMX점을 기록했습니다.
옥테인벤치
마지막으로 OctaneBench를 살펴봅니다. 이것은 OctaneRender 및 RTX를 지원하는 다른 3D 렌더러(V-Ray와 유사)를 위한 벤치마킹 유틸리티입니다.
RTX A6000 총점: 664.40 | |||||
Lenovo ThinkStation P620 | |||||
장면 | 핵심 | ms/s | 비율 | 무게 | 점수 |
내부 | 정보 채널 | 386.4874 | 7.502 | 10 | 18.75424 |
내부 | 직접 조명 | 120.6423 | 6.778 | 40 | 67.77658 |
내부 | 경로 추적 | 60.07888 | 7.035 | 50 | 87.93748 |
생각 | 정보 채널 | 403.6568 | 4.694 | 10 | 11.73557 |
생각 | 직접 조명 | 112.0406 | 5.323 | 40 | 53.22593 |
생각 | 경로 추적 | 101.651 | 5.245 | 50 | 65.56436 |
ATV | 정보 채널 | 369.6832 | 11.777 | 10 | 29.44275 |
ATV | 직접 조명 | 114.5929 | 7.534 | 40 | 75.34053 |
ATV | 경로 추적 | 97.79354 | 7.569 | 50 | 94.61449 |
보물상자 | 정보 채널 | 423.7369 | 6.445 | 10 | 16.11167 |
보물상자 | 직접 조명 | 93.5092 | 6.756 | 40 | 67.56445 |
보물상자 | 경로 추적 | 82.13356 | 6.107 | 50 | 76.33231 |
RTX A6000 총점: 총점: 651.2823 | |||||
HP Z센트럴 4R | |||||
장면 | 핵심 | ms/s | 비율 | 무게 | 점수 |
내부 | 정보 채널 | 381.9805 | 7.414 | 10 | 18.53555 |
내부 | 직접 조명 | 119.4807 | 6.712 | 40 | 67.12399 |
내부 | 경로 추적 | 58.97741 | 6.906 | 50 | 86.32525 |
생각 | 정보 채널 | 393.9745 | 4.582 | 10 | 11.45408 |
생각 | 직접 조명 | 109.6025 | 5.207 | 40 | 52.06769 |
생각 | 경로 추적 | 99.80163 | 5.15 | 50 | 64.37154 |
ATV | 정보 채널 | 363.1271 | 11.568 | 10 | 28.92061 |
ATV | 직접 조명 | 112.0573 | 7.367 | 40 | 73.67342 |
ATV | 경로 추적 | 95.76828 | 7.412 | 50 | 92.65507 |
보물상자 | 정보 채널 | 414.6209 | 6.306 | 10 | 15.76505 |
보물상자 | 직접 조명 | 91.09318 | 6.582 | 40 | 65.81877 |
보물상자 | 경로 추적 | 80.23866 | 5.966 | 50 | 74.57125 |
여기에서 HP 및 Lenovo 워크스테이션 내부에서 사용했을 때 각각 664.40 및 651.28의 전체 점수를 볼 수 있으며, 이는 RTX 3090(전체 점수 671.02)과 매우 유사합니다. 또한 이는 RTX 8000의 점수(전체 점수 315.02점)보다 두 배 이상 높았다.
결론
RTX A6000은 NVIDIA의 인상적인 릴리스입니다. 이 새로운 전문가용 그래픽 카드는 10,752개의 CUDA 처리 코어, 84개의 차세대 RT 코어, 48GB의 GDDR6 RAM을 갖추고 있으며 PCI Express 4.0 x16 인터페이스를 지원합니다. 새로운 NVIDIA 카드는 RTX 6000의 GPU 메모리 크기를 48GB GDDR6로 두 배로 늘려 더 크고 복잡한 3D 데이터 세트로 작업할 수 있도록 합니다. 주머니가 더 크고 48GB 이상의 메모리가 필요한 전문가는 NVIDIA NVLink를 통해 6000개의 A96 카드를 설치하여 결합된 6GB DDRXNUMX RAM을 사용할 수 있습니다.
RTX A6000은 기술적으로 RTX 6000의 후속 제품이지만 RTX 8000–NVIDIA의 이전 최고 워크스테이션 GPU를 직접 대체하는 것입니다. 그럼에도 불구하고 이 마지막 세대 모델에 비해 단순한 반복적 업그레이드 그 이상입니다. 성능 면에서 기념비적인 도약입니다.
그렇다면 어떻게 가능할까요? 가장 중요한 요소는 NVIDIA Ampere입니다. 이 아키텍처는 삼성의 8nm NVIDIA 맞춤형 프로세스(28억 트랜지스터 기능), 개선된 스트리밍 멀티프로세서, 8000세대 레이 트레이싱 코어 및 크게 향상된 레이 트레이싱 하드웨어 가속을 사용합니다. 또한 XNUMX세대 Tensor 코어를 사용하여 AI 추론 성능과 DLSS를 개선하여 더 높은 해상도에서 더 나은 성능을 제공합니다. 이들은 Ampere가 제공하는 하이라이트 중 일부에 불과하므로 RTX AXNUMX이 다음을 제공할 수 있습니다. 거대한 이는 성능 테스트에서 분명하게 드러났습니다.
이를 수행할 수단(및 필요성)이 있는 사람들을 위한 또 다른 흥미로운 기능은 Quadro Sync II 애드인 카드에 대한 RTX A6000의 지원입니다. 각 Quadro Sync II 카드가 최대 6000개의 RTX A32 카드의 출력을 동기화할 수 있으므로 GPU는 단일 시스템(또는 시스템 클러스터) 내에서 호환되는 다양한 GPU의 디스플레이 및 이미지 출력을 모두 동기화할 수 있습니다. 즉, 사용자는 단일 시스템에 최대 XNUMX개의 Quadro Sync II 카드를 설치할 수 있습니다. 즉, XNUMX개의 GPU(각각 XNUMX개의 활성 독립 디스플레이 출력 포함)가 있는 워크스테이션은 최대 XNUMX개의 동기화된 비디오 디스플레이를 지원할 수 있습니다.
RTX A6000은 RTX 8000을 대체하지만 실제로는 RTX 3090과 더 비슷하며 벤치마크 테스트에서 약간 뒤처졌습니다. 앞에서 언급했듯이 이 사소한 성능 차이는 Quadro 드라이버 최적화 및 최신 RAM 때문일 수 있습니다.
그렇다면 RTX A6000은 누구를 위한 것이며 대신 RTX 3090을 구매해야 할까요? 글쎄요. 얻을 GPU를 결정하는 것은 작업 흐름이 무엇이든 또는 단기 미래에 무엇이 될 수 있는지를 기반으로 해야 합니다. 요즘 RTX 카드를 구하는 것은 엄청나게 어렵지만 그렇게 할 수 있는 위치에 있다면 RTX A6000은 주로 CAD(보다 구체적으로 Creo 및 CATIA와 같은 응용 프로그램을 사용하는 과학 분야)에서 일하는 사람들에게 가장 적합합니다. , RTX 3090은 Quadro 카드 라인과 함께 제공되는 필수 드라이버 최적화를 제공하지 않기 때문입니다. 어떤 게임 경험 벤치마크에서도 RTX A6000을 테스트하지는 않았지만 RTX 3090은 특히 레이 트레이싱과 DLSS 2.0을 활용하는 게임에서 돈으로 살 수 있는 최고의 게임용 GPU입니다.
이 모든 것을 감안할 때 Ampere 기반 RTX A6000은 특정 영역에서 시장에 나와 있는 다른 어떤 제품보다 훨씬 뛰어난 성능을 발휘할 것입니다. 따라서 데스크톱 워크스테이션용으로 강력한 비주얼 컴퓨팅 GPU가 필요한 전문가라면 RTX A6000이 적합합니다. 지금 사용할 수 있는 최고의 카드입니다.
StorageReview에 참여
뉴스레터 | 유튜브 | 링크드인 | 인스타그램 | 트위터 | 페이스북 | 틱톡 서비스 | RSS 피드