O AMD Radeon PRO W7900 e W7800 são as novas GPUs de estação de trabalho de última geração da AMD. Estas são as primeiras GPUs chiplet e as primeiras a suportar DisplayPort 2.1. Veja como comparamos essas placas com a RTX A6000 da NVIDIA para ver se os usuários de estações de trabalho de ponta têm novas opções de GPU viáveis para suas cargas de trabalho de aplicativos profissionais, de renderização e de IA mais exigentes.
O AMD Radeon PRO W7900 e W7800 são as novas GPUs de estação de trabalho de última geração da AMD. Estas são as primeiras GPUs chiplet e as primeiras a suportar DisplayPort 2.1. Veja como comparamos essas placas com a RTX A6000 da NVIDIA para ver se os usuários de estações de trabalho de ponta têm novas opções de GPU viáveis para suas cargas de trabalho de aplicativos profissionais, de renderização e de IA mais exigentes.
Especificações AMD Radeon PRO W7900 e W7800
As novas Radeon PRO W7900 e W7800 usam a arquitetura gráfica de terceira geração da AMD, RDNA 3. A mudança radical desta geração é a mudança para uma arquitetura chiplet, que combina chips de diferentes nós de processo para maior flexibilidade, potência e economia.
Em comparação, a arquitetura RNDA 2 da geração anterior era monolítica, com todos os componentes construídos no mesmo processo de 7 nm. O RDNA 3 usa matrizes de 5 nm para as peças de desempenho e matrizes de 6 nm para o cache de memória.
A AMD diz que o RDNA 3 também traz aceleradores de rastreamento de raios de última geração. As unidades de computação possuem “AI Accelerators” integrados que devem melhorar o desempenho de inferência de dados. Para mídia, o RNDA 3 adiciona codificação AV1 acelerada por hardware de até 8K60. Ele também suporta dois fluxos simultâneos de codificação ou decodificação para AVC e HEVC.
Veja as especificações completas do Radeon PRO W7800 e W7900 abaixo, com o Radeon PRO W6800 da geração anterior para referência. Segue nossa análise.
Radeon PRO W7900 | Radeon PRO W7800 | Radeon PRO W6800 | |
Arquitetura GPU | AMD RDNA3 | AMD RDNA2 | |
Contagem de transistor | 57.7 bilhões (5nm GDC 6nm MCD) | 26.8 bilhões (processo de 7 nm) | |
Processadores de fluxo | 6144 (96 unidades de computação) | 4480 (70 unidades de computação) | 3840 (60 unidades de computação) |
Rendimento máximo de FP16 (meia precisão) | Teraflops 122.64 | Teraflops 90.50 | Teraflops 35.66 |
Rendimento máximo de FP32 (precisão única) | Teraflops 61.32 | Teraflops 45.25 | Teraflops 17.83 |
Cache Infinito AMD (L3) | 96MB | 64MB | 128MB |
Memória Gráfica Dedicada | 48GB GDDR6 | 32GB GDDR6 | 32GB GDDR6 |
Bus de Memória | 384-bit | 256-bit | 256-bit |
Largura de banda de memória máxima | 864 GB / s | 576 GB / s | 512 GB / s |
Suporte PCI Express | Compatibilidade com versões anteriores 4.0 (x4)/3.0 | ||
Suporte de código de correção de erros (ECC) | Sim | ||
Conectores de tela | 3x DisplayPort 1.2; 1 x Mini DisplayPort 2.1 aprimorado | 6x Mini-DisplayPort 1.4 com DSC | |
Saída de exibição |
|
|
|
Potência total da placa | 295 W | 260 W | 250 W |
Conectores de alimentação | 2x 8-pin | 6 pinos + 8 pinos | |
Recomendação de PSU | mínimo de 650 watts | ||
Fator de Forma da Placa | Altura total, 3 slots, comprimento de 11" (280 mm) | Altura total, 2 slots, comprimento de 11" (280 mm) | Altura total, 2 slots, 10.5" (267 mm) |
A Radeon PRO W7800 supera sua contraparte da geração anterior em quase todas as áreas. A contagem de transistores mais que dobra, de 26.8 para 57.7 bilhões, assim como as taxas de transferência de pico FP16 e FP32. O Infinity Cache do W7800 é menor (64 MB em vez de 128 MB), mas é mais forte em qualquer outro lugar, incluindo a largura de banda da memória, apesar de manter um barramento de 256 bits. E por tudo isso, a potência total da placa aumentou apenas 10 watts para 260 watts. A AMD não estava brincando sobre a arquitetura RDNA 3 ser muito mais eficiente em termos de energia.
Depois, há o monstro que é o AMD Radeon PRO W7900. Ele compartilha a contagem de transistores do W7800, mas salta muito à frente em outros lugares; ele tem 96 versus 70 unidades de computação, o que significa muito mais poder computacional. (Isso ficará evidente em nossos benchmarks.)
Também notável é seu cache infinito maior (96 MB versus 64 MB) e um barramento de memória de 384 bits muito mais amplo, fornecendo 864 GB/s de largura de banda de pico de memória contra os 7800 GB/s do W576. Esse desempenho vem com o custo de um design de placa maior de 3 slots e um aumento relativamente modesto na potência da placa de 260 para 295 watts.
Curiosamente, as novas placas Radeon PRO suportam dois monitores não compactados de 8K ou um único monitor de 12K (12,288 por 6,912 pixels) sempre que este último chegar ao mercado. (Exibições 8K são difíceis de encontrar.) Falando em saída de vídeo, a AMD diz que essas novas placas Radeon PRO são as primeiras a oferecer suporte a DisplayPort 2.1, que oferece 54 Gbps de largura de banda, o dobro do suportado por placas RDNA 2 com DisplayPort 1.4.
No lado do software muito importante, o Radeon PRO W7800 e o W7900 têm drivers especiais disponíveis através do AMD Software: PRO Edition. A AMD certifica essas placas com mais de 100 aplicativos por meio de seu programa Independent Software Vendor (ISV) e possui um programa de certificação ISV de dia zero. A AMD também incentiva os desenvolvedores a escrever código portátil para suas e outras GPUs, expandindo a API de desempenho HIP.
AMD Radeon PRO W7900 vs. Geração NVIDIA RTX A6000 Ada
Agora vamos juntar as principais placas de estação de trabalho da AMD e da NVIDIA, a Radeon PRO W7900 e a RTX A6000 Ada Generation. Incluí também a RTX A6000 da geração anterior, placa que usaremos para comparação de desempenho. Incluí apenas algumas especificações, já que muitos não serão laranjas para laranjas; as arquiteturas entre os cartões são simplesmente muito diferentes.
(Veja NVIDIA para mais informações técnicas.)
AMD Radeon PRO W7900 | Geração NVIDIA RTX A6000 Ada | Nvidia RTX A6000 | |
Memória | ECC GDDR48 de 6 GB | ||
Interface de Memória | 384-bit | ||
Largura de banda de memória | 864 GB / s | 960 GB / s | 768 GB / s |
Desempenho de precisão única | Teraflops 61.32 | Teraflops 91.1 | Teraflops 38.7 |
Potência total da placa | watts 295 | watts 300 | |
Fator de Forma | 11" de comprimento, 3 slots | 10.5" de comprimento, 2 slots | |
Conector de força | 2x 8-pin | 1 x PCIe CEM5 de 16 pinos | 1x 8-pin |
Conectores de tela | 3x DisplayPort 1.2; 1 x Mini DisplayPort 2.1 aprimorado | 4 portas DisplayPort 1.2a |
Todos os três têm um buffer de quadro GDDR48 ECC de 6 GB e um barramento de memória de 384 bits. Não incluí o núcleo NVIDIA Tensor/CUDA ou o núcleo AMD Compute, pois não são comparáveis, mesmo dentro do ecossistema da NVIDIA, mas o desempenho de precisão única fornece uma boa linha de base. O Radeon PRO W7900 está claramente um passo acima do RTX A6000 nessa métrica, mas não do RTX A6000 Ada Generation.
As placas NVIDIA têm uma vantagem de tamanho, exigindo apenas dois slots, enquanto a Radeon PRO W7900 é meia polegada mais longa e requer três slots. A potência total da placa é aproximadamente a mesma para todas as placas. A AMD tem uma possível vantagem no suporte ao DisplayPort 2.1, embora você precise de um monitor de suporte.
Projeto AMD Radeon PRO W7900 e W7800
O AMD Radeon PRO W7900 e W7800 são placas de estação de trabalho, então não vamos ver nenhuma luz RGB chamativa ou coolers sofisticados. Ambas as placas têm 11 polegadas (280 mm) de comprimento e possuem um cooler estilo soprador, ideal para o fluxo de ar da estação de trabalho. Todo o escape de resfriamento sai pela parte de trás do cartão.
A altura do slot é onde os cartões diferem; o Radeon PRO W7800 ocupa dois slots, enquanto o W7900 ocupa três.
Ambas as placas usam uma configuração de alimentação tradicional de 2x 8 pinos. A AMD recomenda uma fonte de alimentação de 650 watts no mínimo.
Virando os cartões, novamente não vemos nada extravagante, mas este cartão tem tudo a ver com desempenho e, além da simples marca no cooler do soprador, mantém a estética mínima.
Desempenho AMD Radeon PRO W7900 e W7800
Estamos usando nosso auto-construído Equipamento de teste StorageReview para testes de desempenho; uma área de trabalho é configurada da seguinte maneira:
- CPU Intel Core i9-12900K com refrigeração líquida
- Placa-mãe Asus ROG Strix Z690-E Gaming WiFi
- Microsoft Windows 11
- 32 GB de RAM Kingston Fury DDR5-5200 (2x 16 GB)
- Seagate Fire Cuda 530 2TB SSD
Esta não é uma estação de trabalho no sentido de que não está usando uma CPU de classe de servidor ou estação de trabalho, mas tem a vantagem de oferecer suporte ao PCIe 4.0, que precisamos, dada a largura de banda que essas novas placas gráficas exigem.
Estamos comparando as placas Radeon PRO com a NVIDIA RTX-A6000. Esta é uma placa de geração anterior, não aquela baseada na arquitetura Ada Generation, mas ainda assim fornecerá uma comparação sólida. Testamos novamente o cartão para esta revisão.
Observe que executamos todos os testes com a resolução do monitor configurada para 3840 x 2160 (4K/UHD). Vamos aos testes.
Benchmark UL Labs Procyon AI
Apresentando uma variedade de mecanismos de inferência de Inteligência Artificial de fornecedores de primeira linha, o Benchmark UL Procyon AI Inference atende a um amplo espectro de configurações e requisitos de hardware. A pontuação de referência fornece um resumo conveniente e padronizado do desempenho de inferência no dispositivo. Isso nos permite comparar e contrastar diferentes configurações de hardware em situações do mundo real sem a necessidade de soluções internas.
É importante considerar que as placas AMD não podem executar benchmarks do Tensor. No entanto, estamos incluindo-o para mostrar a diferença no desempenho. Selecionamos o teste Windows AI e comparamos os novos W7900 e W7800 com o A6000 da NVIDIA. A nova AMD Radeon PRO W7900 consegue ficar à frente da NVIDIA A6000 em AI Inferencing em alguns dos testes, bem como em uma pontuação geral, mas é importante observar os resultados granulares de cada teste.
Teste | A6000 Tensor (ref.) |
A6000 IA do Windows |
W7900 Windows AI |
W7800
IA do Windows |
Pontuação geral | 1068 | 818 | 846 | 729 |
MobileNet V3 Média Tempo de Inferência | 0.57 | 0.68 | 0.46 | 0.48 |
ResNet 50 Média Tempo de Inferência | 1.45 | 1.64 | 1.60 | 2.14 |
Inception V4 Média Tempo de Inferência | 4.56 | 4.06 | 6.65 | 7.44 |
DeepLab V3 Avg. Tempo de Inferência | 4.99 | 14.58 | 15.50 | 17.63 |
YOLO V3 Avg. Tempo de Inferência | 4.38 | 6.31 | 6.92 | 8.39 |
REAL-ESRGAN Média Tempo de Inferência | 127.24 | 125.34 | 80.74 | 92.22 |
SPECviewperf2020
O benchmark SPECviewperf 2020 é o padrão mundial para medir o desempenho gráfico de aplicativos profissionais executados nas interfaces de programação de aplicativos OpenGL e Direct X. Os conjuntos de visualizações (ou benchmarks) representam conteúdo gráfico e comportamento de aplicativos reais sem a necessidade de instalar os próprios aplicativos. Esses conjuntos de visualizações incluem 3D Max, CATIA, Creo, Energy, Maya, Medical, Siemens NX e Solidworks. Números mais altos são melhores.
Há um pouco de cabo de guerra entre o Radeon PRO W7900 e o RTX A6000, com os despojos geralmente indo para o último. O Radeon PRO W7800 segue sua contraparte mais poderosa, com o desempenho do W7900 cerca de 15% a 34% melhor. Isso faz sentido; o Radeon PRO W7900 tem 37% mais unidades de computação do que o W7800 (96 versus 70).
Conjuntos de visualizações | AMD Radeon PRO W7900 | AMD Radeon PRO W7800 | NVIDIA RTX-A6000 |
3dsmax-07 | 112.84 | 98.44 | 141.57 |
Cátia-06 | 19.01 | 18.3 | 102.24 |
Creo-03 | 150.26 | 125.2 | 159.46 |
Energia-03 | 67.22 | 49.99 | 42.59 |
Maya-06 | 301.14 | 230.9 | 352.93 |
Médico-03 | 75.78 | 56.26 | 34.75 |
Snx-04 | 322.58 | 282.52 | 449.85 |
solidworks-05 | 204.29 | 153.82 | 169.7 |
ESRI
O próximo é o benchmark do Instituto de Pesquisa de Sistemas Ambientais (Esri). A Esri é fornecedora de software de Sistema de Informação Geográfica (GIS). A equipe de desempenho da Esri projetou seus scripts de suplemento PerfTool para iniciar o ArcGIS Pro automaticamente. Este aplicativo usa uma função “ZoomToBookmarks” para navegar em vários marcadores predefinidos e criar um arquivo de log com todos os principais pontos de dados necessários para prever a experiência do usuário. O script repete automaticamente os marcadores três vezes para contabilizar o cache (memória e cache de disco). Em outras palavras, este benchmark simula o uso gráfico pesado que pode ser visto através do software ArcGIS Pro da Esri.
Os testes consistem em três conjuntos de dados principais. Duas são vistas 3-D da cidade de Filadélfia, PA, e Montreal, QC. Essas vistas da cidade contêm edifícios multipatch 3-D texturizados dispostos em um modelo de terreno e imagens aéreas cobertas. O terceiro conjunto de dados é uma visualização de mapa 2-D da região de Portland, OR. Esses dados contêm informações detalhadas sobre estradas, parcelas de uso da terra, parques e escolas, rios, lagos e terrenos sombreados por colinas.
A animação de Montreal é a primeira. Em um sinal do que está por vir, o RTX A6000 dizimou a dupla AMD. A vantagem de desempenho do Radeon PRO W7900 sobre o W7800 subiu para 44% de acordo com os números médios de fps.
ESRI ArcGIS Pro 2.3 Montreal | |
FPS médio | Média |
AMD Radeon PRO W7900 | 265.07 |
AMD Radeon PRO W7800 | 183.44 |
Nvidia RTX A6000 | 601.50 |
FPS mínimo | Média |
AMD Radeon PRO W7900 | 108.65 |
AMD Radeon PRO W7800 | 88.10 |
Nvidia RTX A6000 | 324.85 |
O conjunto de visualizações Philly é o próximo; o desempenho amplamente superior do RTX A6000 continua. A vantagem do Radeon PRO W7900 sobre o W7800 é menos pronunciada aqui.
ESRI ArcGIS Pro 2.3 Filadélfia | |
FPS médio | Média |
AMD Radeon PRO W7900 | 252.36 |
AMD Radeon PRO W7800 | 199.17 |
Nvidia RTX A6000 | 474.97 |
FPS mínimo | Média |
AMD Radeon PRO W7900 | 107.28 |
AMD Radeon PRO W7800 | 106.99 |
Nvidia RTX A6000 | 276.65 |
O último é Portland, onde o RTX A6000 simplesmente foge. A Radeon PRO W7800 e a W7900 têm desempenho quase idêntico porque esse subteste é limitado pela CPU.
ESRI ArcGIS Pro 2.3 Portland | |
FPS médio | Média |
AMD Radeon PRO W7900 | 332.23 |
AMD Radeon PRO W7800 | 322.56 |
Nvidia RTX A6000 | 3,513.32 |
FPS mínimo | Média |
AMD Radeon PRO W7900 | 201.55 |
AMD Radeon PRO W7800 | 208.67 |
Nvidia RTX A6000 | 1,641.34 |
Luxmark
Outro benchmark 3D que veremos é o LuxMark, um utilitário de benchmarking de GPU OpenCL. Aqui, o Radeon PRO W7900 mostra ganhos consideráveis sobre o RTX A6000; o Radeon PRO W7800 não está no mesmo nível que o RTX A6000.
LuxMark (mais alto é melhor) | |||
Categoria | AMD Radeon PRO W7900 | AMD Radeon PRO W7800 | Nvidia RTX A6000 |
banco de entrada | 22,538 | 16,692 | 20,867 |
comida | 10,264 | 5,542 | 7,869 |
Liquidificador OptiX
O próximo é o Blender, um aplicativo de modelagem 3D de código aberto. Este benchmark foi executado usando o utilitário Blender Benchmark, com NVIDIA OptiX como o método de renderização escolhido. A pontuação é em amostras por minuto, com maior sendo melhor.
Este benchmark parece ser otimizado para NVIDIA, e mostra; o RTX A6000 está muito à frente até mesmo do Radeon PRO W7900.
Blender OptiX, amostras por minuto (quanto maior, melhor) | |||
Categoria | AMD Radeon PRO W7900 | AMD Radeon PRO W7800 | Nvidia RTX A6000 |
Monstro | 1,820.20 | 1,268.35 | 2,818.73 |
sucata | 960.66 | 684.83 | 1,794.18 |
Sala de aula | 843.99 | 635.85 | 1,535.98 |
Teste de velocidade Blackmagic RAW
Nosso último teste é o novo Blackmagic RAW Speed Test. Os Radeon PROs no OpenCL não conseguiram capturar o RTX A6000 com CUDA.
Blackmagic RAW (quanto maior, melhor) | |||
AMD Radeon PRO W7900 | AMD Radeon PRO W7800 | Nvidia RTX A6000 | |
GPU 8K | 36 fps | 35 fps | 139 fps |
Conclusão
O AMD Radeon PRO W7900 e o W7800 geralmente não alcançaram o NVIDIA RTX A6000 em nossos benchmarks, embora tenham alcançado algumas vitórias. Dito isso, a AMD nunca afirmou que a Radeon PRO W7900 venceria definitivamente a RTX A6000 – mais ou menos, o objetivo era pegá-la e entregar a nova família de GPUs AMD a um preço muito mais baixo. O preço é uma noção crítica para esses cartões, especialmente em IA, onde muitas organizações estão tentando medir seus investimentos em IA até conseguirem lidar melhor com o impacto nos negócios.
Grande parte do processo de compra da placa gráfica da estação de trabalho se resume ao software que você está usando e ao quão bem ele é suportado pela AMD ou NVIDIA, que determina principalmente o desempenho das placas. O benchmark SPECviewperf2020 que executamos provavelmente oferece a visão mais geral do que esperar em 3D OpenGL e DirectX. Esse foi um dos únicos testes em que a Radeon PRO W7900 e a RTX A6000 trocaram golpes – alguns dos subtestes foram próximos, outros muito a favor de uma placa ou de outra. Portanto, a Radeon PRO W7900 pode levar vantagem em algumas situações.
Em áreas como Blackmagic RAW ou Procyon, onde a otimização CUDA ou Tensor entra em ação, os produtos NVIDIA ainda mantêm uma liderança significativa. É uma espécie de situação de galinha e ovo; A otimização de GPU segue a saturação do mercado, então, conforme modelos específicos ganham popularidade, a otimização para eles segue o exemplo. Se aprendemos alguma coisa com os números de desempenho aqui, está claro que a AMD está indo em uma direção muito positiva, o que, é claro, ajudará em sua adoção.
Como observado, o verdadeiro trunfo da AMD é o preço; o Radeon PRO W7900 tem um MSRP de $ 3,999, enquanto o NVIDIA RTX A6000 Ada Generation custa cerca de $ 6,800, e o não-Ada que comparamos aqui é de aproximadamente $ 5,400. O desempenho relativo por dólar que você obtém com a placa AMD geralmente pode funcionar a seu favor.
No geral, estamos entusiasmados com o fato de as novas placas Radeon PRO trazerem a arquitetura chiplet para as GPUs. Também gostamos das tecnologias avançadas da AMD, especialmente a inclusão do DisplayPort 2.1 pela primeira vez. Essas novas entradas do Team Red podem superar a NVIDIA em alguns cenários e outros não, e no geral parecem ter um bom desempenho para seu preço e público. É uma vitória para a indústria ter mais opções e, claramente, a AMD está mostrando que pretende ser um concorrente sério no mercado de GPU para estações de trabalho.
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Discord | RSS feed