A NVIDIA RTX A4000 faz parte da mais recente linha de GPU profissional para desktop da empresa, destinada a estações de trabalho que precisam de alto desempenho para rastreamento de raios em tempo real, computação acelerada por IA e gráficos de alto desempenho. Aproveitando a arquitetura RTX de segunda geração, a NVIDIA afirma que o A4000 é a GPU de slot único mais poderosa disponível no mercado para profissionais.
A NVIDIA RTX A4000 faz parte da mais recente linha de GPU profissional para desktop da empresa, destinada a estações de trabalho que precisam de alto desempenho para rastreamento de raios em tempo real, computação acelerada por IA e gráficos de alto desempenho. Aproveitando a arquitetura RTX de segunda geração, a NVIDIA afirma que o A4000 é a GPU de slot único mais poderosa disponível no mercado para profissionais.
O A4000 fica logo atrás do RTX A5000 e RTX-A6000 na nova linha de placas RTX profissionais da NVIDIA, com 48 núcleos RT (2nd gen), 192 Tensor Cores de terceira geração e 6,144 núcleos CUDA com 16 GB de memória gráfica. Enquanto a NVIDIA abandonou o nome Quadro para distinguir sua linha profissional, o RTX A4000 ainda apresenta os mesmos recursos profissionais, certificações de hardware e software, drivers certificados pelos quais a linha Quadro era conhecida.
Para conectividade, o A4.4 de 9.5” de altura x 4000” de comprimento possui quatro portas DisplayPort 1.4a e a porta de alimentação PCIe de 1 x 6 pinos usual. A ventilação corre ao longo da parte superior de cada um dos DisplayPorts e na parte frontal da placa, enquanto uma ventoinha menor fica no lado oposto.
NVIDIA RTX A4000 x Quadro RTX 4000
A NVIDIA considera o RTX A4000 como um sucessor do Quadro RTX 4000, um cartão antigo com alguns anos no momento desta análise. Em nossa análise de 2019, o RTX 4000 apresentou um desempenho impressionante para uma placa básica, tornando-o um ótimo complemento para o portfólio impressionante da empresa, com um preço de aproximadamente US $ 900 quando foi lançado. Dito isso, com os avanços que a NVIDIA fez recentemente em sua arquitetura de GPU, estamos sempre ansiosos para ver o que eles têm reservado para suas placas de classe de estação de trabalho.
Imediatamente você verá que o A4000 dobra a memória GPU do cartão Quadro para 16 GB e quase triplica a contagem de núcleos CUDA. Combinando isso com um ligeiro aumento na largura de banda da memória (448 GB/s), o novo A4000 já parece significativamente melhor. Essas especificações o tornam mais compatível com o RTX 3070, a placa de consumo de desktop de alto desempenho da NVIDIA.
NVIDIA Ampere
Como mencionamos em nosso Avaliação RTX A6000, a atualização mais significativa para as placas gráficas profissionais de última geração da empresa é NVIDIA Ampere. É aqui que reside o verdadeiro salto no desempenho. Destaques desta nova arquitetura que utiliza o processo personalizado NVIDIA de 8 nm da Samsung com 28 bilhões de transistores. Ele também possui um multiprocessador de streaming aprimorado e núcleos Ray Tracing de segunda geração (que melhoram a aceleração de hardware de rastreamento de raios) e Tensor Cores de terceira geração, o último dos quais melhora o desempenho de inferência de AI e DLSS, resultando em melhor desempenho em resoluções mais altas.
A arquitetura Ampere também aumenta os núcleos CUDA em até o dobro do ponto flutuante de precisão única em comparação com os modelos de última geração. Isso significa melhorias perceptíveis de desempenho em áreas como desenvolvimento de modelos 3D e tarefas como simulação de desktop para engenharia auxiliada por computador.
Apoiado por uma garantia de 3 anos, o NVIDIA RTX A4000 custa cerca de US $ 2,000, dependendo da marca.
Especificações NVIDIA RTX A4000
memória da GPU | 16 GB GDDR6 |
Interface de memória | 256-bit |
Largura de banda de memória | 448 GB / s |
Código de correção de erros (ECC) | Sim |
Núcleos CUDA baseados na arquitetura NVIDIA Ampere | 6,144 |
NVIDIA Tensor Cores de terceira geração | 192 |
NVIDIA RT Cores de segunda geração | 48 |
Desempenho de precisão única | 19.2 TFLOPS3 |
Desempenho do Núcleo RT | 37.4 TFLOPS3 |
Desempenho do tensor | 153.4 TFLOPS4 |
Interface do sistema | PCI Express 4.0 x16 |
Consumo de energia | Potência total da placa: 140 W |
Solução térmica | Ativo |
Fator de forma | 4.4" A x 9.5" C,
slot único |
Conectores de exibição | 4 portas DisplayPort 1.4a |
Exibições simultâneas máximas | 4x 4096 x 2160 a 120 Hz,
4x 5120 x 2880 a 60 Hz, 2x 7680 x 4320 a 60 Hz |
Conector de força | 1 x PCIe de 6 pinos |
Motores de codificação/decodificação | 1x codifica, 1x decodifica (+AV1 decodificação) |
Pronto para VR | Sim |
APIs gráficas | DirectX 12.075, Shader Model 5.175,
OpenGL 4.686, Vulkan 1.26 |
APIs de computação | CUDA, DirectCompute, OpenCL™ |
Nvidia RTX A4000 Desempenho
Para avaliar seu desempenho, colocamos o RTX A4000 em uma série de testes com uso intensivo de recursos e o comparamos com o RTX A6000 de classe superior para mostrar as diferenças entre as duas extremidades do espectro da arquitetura RTX de segunda geração. Instalamos o A4000 e o A6000 dentro de um Lenovo Think Station P620 e HP Z Central 4R para testes.
HP Z Central 4R:
- Intel Xeon 2295 (frequência base de 3.0 GHz, até 4.6 GHz com tecnologia Intel vPro)
- 64 GB de SDRAM DDR4-2933 ECC
- 1TB M.2 SSD
Lenovo Think Station P620:
- Processador AMD Ryzen Threadripper Pro 3995WX (2.70 GHz, até 4.20 GHz Max Boost, 64 núcleos, 128 threads, 32 MB de cache)
- 64GB de DDR4 RAM
- SSD PM1 de 981 TB
SPECviewperf 2020
O primeiro é o benchmark SPECviewperf 2020, o padrão mundial para medir o desempenho gráfico de aplicativos profissionais executados nas interfaces de programação de aplicativos OpenGL e Direct X. Os conjuntos de visualizações (ou benchmarks) representam conteúdo gráfico e comportamento de aplicativos reais, sem a necessidade de instalar os próprios aplicativos. Esses conjuntos de visualizações incluem 3D Max, CATIA, Creo, Energy, Maya, Medical, Siemens NX e Solidworks.
Conjuntos de visualizações | NVIDIA RTX 4000 Lenovo ThinkStation P620 |
Nvidia RTX A4000 HP Z Central 4R |
Nvidia RTX A6000 Lenovo Think Station P620 | NVIDIA RTX A6000 HP Z Central 4R |
3dsmax-07 | 90.29 | 90.8 | 131.96 | 127.89 |
Cátia-06 | 67.54 | 58.75 | 90.99 | 75.32 |
Creo-03 | 103.84 | 90.65 | 125.88 | 99.54 |
Energia-03 | 21.97 | 22.16 | 42.22 | 38.83 |
Maya-06 | 224.81 | 215.15 | 314.82 | 273.01 |
Médico-03 | 22.55 | 21.53 | 34.87 | 30.58 |
Snx-04 | 322.7 | 328.37 | 450.72 | 422.01 |
SW-05 | 107.06 | 108.76 | 161.4 | 152.19 |
Para este benchmark, a RTX A4000 apresentou ótimo desempenho tanto nos sistemas Lenovo quanto nos sistemas HP (que apresentaram resultados muito semelhantes) devido à nova arquitetura Ampere. Você notará a mesma tendência no restante de nossos benchmarks.
Embora o diferencial de desempenho do modelo de ponta (A6000) às vezes seja significativo, o A4000 ainda oferece bastante desempenho para os casos de uso mais intensivos.
Em seguida, executamos o SPECworkstation3, um teste especializado em benchmarks projetados para testar todos os principais aspectos do desempenho da estação de trabalho; ele usa mais de 30 cargas de trabalho para testar CPU, gráficos, E/S e largura de banda de memória. As cargas de trabalho se enquadram em categorias mais amplas, como mídia e entretenimento, serviços financeiros, desenvolvimento de produtos, energia, ciências biológicas e operações gerais. Vamos listar os resultados de categoria ampla para cada um, em oposição às cargas de trabalho individuais. Os resultados são uma média de todas as cargas de trabalho individuais em cada categoria.
Estação de trabalho SPEC3
Categoria | NVIDIA RTX A4000 Lenovo ThinkStation P620 | NVIDIA RTX A4000 HP Z Central 4R |
NVIDIA RTX A6000 Lenovo ThinkStation P620 | NVIDIA RTX A6000 HP ZCentral 4R |
MIM | 5.87 | 3.37 | 6.04 | 3.49 |
ProdDesv | 5.01 | 3.35 | 5.49 | 3.63 |
Ciências da Vida | 3.99 | 3.51 | 4.61 | 3.76 |
Energia | 4.68 | 2.58 | 5.58 | 2.79 |
FSI | 9.46 | 3.96 | 9.49 | 3.38 |
Operações Gerais | 2.2 | 1.59 | 2.14 | 1.63 |
Compute GPU | 5.25 | 5.19 | 7.44 | 7.22 |
No geral, vimos um desempenho mais impressionante com o A4000 quando instalado dentro do P620, às vezes até oferecendo resultados semelhantes ou até melhores em comparação com o A6000 (especificamente nas categorias de operações gerais e serviços financeiros). Quando preenchido dentro da estação de trabalho HP ZCentral, o A4000 mostrou números notavelmente mais baixos, com exceção da categoria de computação GPU.
Instituto de Pesquisa de Sistemas Ambientais (ESRI)
O próximo é o benchmark do Instituto de Pesquisa de Sistemas Ambientais (Esri). A Esri é fornecedora de software Geographic Information System (GIS), enquanto sua equipe de desempenho projetou seus scripts de suplemento PerfTool para iniciar automaticamente o ArcGIS Pro.
Este aplicativo usa uma função “ZoomToBookmarks” para navegar em vários marcadores predefinidos e criar um arquivo de log com todos os principais pontos de dados necessários para prever a experiência do usuário. O script repete automaticamente os marcadores três vezes para contabilizar o cache (memória e cache de disco). Em outras palavras, este benchmark simula o uso gráfico pesado que pode ser visto através do software ArcGIS Pro da Esri.
Os testes consistem em três conjuntos de dados principais. Duas são vistas 3-D da cidade de Filadélfia, PA, e Montreal, QC. Essas vistas da cidade contêm edifícios multipatch 3-D texturizados dispostos em um modelo de terreno e imagens aéreas cobertas. O terceiro conjunto de dados é uma visualização de mapa 2-D da região de Portland OR. Esses dados contêm informações detalhadas sobre estradas, parcelas de uso da terra, parques e escolas, rios, lagos e terrenos sombreados por colinas.
O primeiro é Montreal. Aqui, o RTX A4000 atingiu FPS médio de 471.31 e FPS mínimo de 194.66 dentro do P620. A configuração do HP ZCentral 4R apresentou um FPS médio de 349.32 e um FPS mínimo de 167.86.
ESRI ArcGIS Pro 2.3 Montreal | |
FPS médio | |
NVIDIA RTX A4000 (Think Station P620) | 471.31 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 349.32 |
Nvidia RTX A6000 | 614.03 |
FPS mínimo | |
NVIDIA RTX A4000 (Think Station P620) | 194.66 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 167.86 |
Nvidia RTX A6000 | 238.18 |
Em seguida é Philly. Aqui, o RTX A4000 atingiu um FPS médio de 323.15 e um FPS mínimo de 164.68 dentro do P620. A configuração do HP ZCentral 4R apresentou FPS médio e mínimo de 363.24 e 202.02, respectivamente.
ESRI ArcGIS Pro 2.3 Filadélfia | |
FPS médio | |
NVIDIA RTX A4000 (Think Station P620) | 323.15 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 363.24 |
Nvidia RTX A6000 | 542.70 |
FPS mínimo | |
NVIDIA RTX A4000 (Think Station P620) | 164.68 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 202.02 |
Nvidia RTX A6000 | 237.54 |
Nosso último modelo é o de Portland onde o RTX A4000 teve um FPS médio de 2,305.81, e um FPS mínimo de 790.43 dentro do P620. A configuração do HP ZCentral 4R apresentou FPS médio e mínimo de 1,694.04 e 637.65, respectivamente.
ESRI ArcGIS Pro 2.3 Portland | |
FPS médio | |
NVIDIA RTX A4000 (Think Station P620) | 2,305.81 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 1,694.04 |
Nvidia RTX A6000 | 2,756.82 |
FPS mínimo | |
NVIDIA RTX A4000 (Think Station P620) | 790.43 |
NVIDIA RTX A4000 (HP ZCentral 4R) | 637.65 |
Nvidia RTX A6000 | 906.17 |
liqüidificador
O próximo é o onipresente Blender, um aplicativo de modelagem 3D de código aberto. Este benchmark foi executado usando o utilitário Blender Benchmark. NVIDIA OptiX foi o método de renderização escolhido, ao contrário de CUDA, já que o A4000 (como o A6000 de ponta) pode utilizar RTX. Neste benchmark medido em segundos, quanto mais baixo melhor.
Embora o A6000 tenha sido quase duas vezes mais rápido quando instalado dentro do P620 e HP ZCentral 4R, isso era esperado e o A4000 ainda mostrou resultados de próxima geração para sua classe.
Lux Mark
LuxMark é uma ferramenta de benchmarking de plataforma cruzada OpenCL daqueles que mantêm o mecanismo de renderização 3D de código aberto, LuxRender. Essa ferramenta analisa o desempenho da GPU nas áreas de modelagem 3D, iluminação e trabalho de vídeo. Para esta revisão, usamos a versão mais recente, v4alpha0. No LuxMark, mais alto é melhor quando se trata de pontuação.
Dentro do Lenovo P620, o RTX A4000 marcou 4,627 na categoria de renderização de alimentos, enquanto o Hallbench mostrou 12,314. Estes ficaram atrás da maioria das unidades testadas, mas, novamente, os resultados ainda foram bons, pois as outras GPUs testadas estão equipadas com componentes de alto desempenho.
Dentro de um HP ZCentral 4R, o RTX A4000 obteve uma pontuação de 12,117 e 4,540 para as categorias de alimentação e Hallbench, respectivamente.
Banco Octane
Por fim, examinamos o OctaneBench. Este é um utilitário de benchmarking para OctaneRender e outro renderizador 3D com suporte RTX (semelhante ao V-Ray).
Pontuação total RTX A4000: 392.47 | |||||
Lenovo Think Station P620 | |||||
Cena | Núcleo | Senhora/s | Relação | Peso | Pontuação |
Interior (por Julia Lynen) | canais de informação | 239.64 | 4.651 | 10 | 11.63 |
Interior (por Julia Lynen) | iluminação direta | 71.47 | 4.015 | 40 | 40.15 |
Interior (por Julia Lynen) | rastreamento de caminho | 35.13 | 4.113 | 50 | 51.41 |
Idéia (por Julio Cayetano) | canais de informação | 247.17 | 2.874 | 10 | 7.19 |
Idéia (por Julio Cayetano) | iluminação direta | 66.43 | 3.156 | 40 | 31.56 |
Idéia (por Julio Cayetano) | rastreamento de caminho | 60.06 | 3.099 | 50 | 38.74 |
ATV (por Jurgen Aleksejev) | canais de informação | 223.54 | 7.121 | 10 | 17.80 |
ATV (por Jurgen Aleksejev) | iluminação direta | 67.25 | 4.421 | 40 | 44.21 |
ATV (por Jurgen Aleksejev) | rastreamento de caminho | 57.24 | 4.430 | 50 | 55.38 |
Caixa (por Enrico Cerica) | canais de informação | 259.13 | 3.941 | 10 | 9.85 |
Caixa (por Enrico Cerica) | iluminação direta | 55.13 | 3.983 | 40 | 39.83 |
Caixa (por Enrico Cerica) | rastreamento de caminho | 48.12 | 3.578 | 50 | 44.72 |
Pontuação total RTX A4000: 391.72 | |||||
HP Z Central 4R | |||||
Cena | Núcleo | Senhora/s | Relação | Peso | Pontuação |
Interior (por Julia Lynen) | canais de informação | 238.19 | 4.623 | 10 | 11.56 |
Interior (por Julia Lynen) | iluminação direta | 71.49 | 4.017 | 40 | 40.17 |
Interior (por Julia Lynen) | rastreamento de caminho | 35.14 | 4.114 | 50 | 51.43 |
Idéia (por Julio Cayetano) | canais de informação | 244.42 | 2.842 | 10 | 7.11 |
Idéia (por Julio Cayetano) | iluminação direta | 66.26 | 3.148 | 40 | 31.48 |
Idéia (por Julio Cayetano) | rastreamento de caminho | 59.98 | 3.095 | 50 | 38.68 |
ATV (por Jurgen Aleksejev) | canais de informação | 222.32 | 7.083 | 10 | 17.71 |
ATV (por Jurgen Aleksejev) | iluminação direta | 67.12 | 4.413 | 40 | 44.13 |
ATV (por Jurgen Aleksejev) | rastreamento de caminho | 57.19 | 4.426 | 50 | 55.33 |
Caixa (por Enrico Cerica) | canais de informação | 257.61 | 3.918 | 10 | 9.80 |
Caixa (por Enrico Cerica) | iluminação direta | 54.97 | 3.971 | 40 | 39.71 |
Caixa (por Enrico Cerica) | rastreamento de caminho | 48.02 | 3.570 | 50 | 44.63 |
Aqui, vemos uma pontuação geral de 392.47 e 391.72 quando preenchidos nas estações de trabalho HP e Lenovo, respectivamente. Isso é aproximadamente metade do que o A8000 é capaz; no entanto, é um resultado impressionante para um cartão básico e certamente supera seu antecessor.
Em comparação com placas de consumo de última geração, o site oficial da OctaneBench pontuou os poderosos RTX 3070 e 3060 TI e RTX 3080 (modelo de laptop) com 400 e 376, respectivamente, enquanto o Quadro RTX 4000 mostraram apenas 228 em seus gráficos.
Conclusão
O RTX A4000 é o mais recente lançamento de médio porte da NVIDIA de seu portfólio de GPUs profissionais baseadas na arquitetura RTX de segunda geração. Enquanto o A6000 é o melhor desempenho com um preço premium, o novo A4000 é o cartão mais acessível da linha, apresentando 6,144 núcleos de processamento CUDA, 48 núcleos RT de última geração, suporte a HDCP 2.2 e interface PCI Express 4.0 x16. Ele também pode se conectar a um máximo de quatro monitores de 4096 x 2160 a 120 Hz. Este cartão destina-se a profissionais com necessidades mais modestas e um orçamento menor, embora ainda possa lidar com uma ampla gama de cargas de trabalho profissionais com uso intensivo de recursos.
A NVIDIA indica que esta é essencialmente uma substituição da Quadro RTX 4000; mas isso é certamente um eufemismo, já que o novo A4000 o supera em todos os sentidos. O desempenho está mais alinhado com a versão desktop do tão procurado e poderoso RTX 3070. Dito isso, a nova placa NVIDIA dobra o tamanho da memória GPU do RTX 4000 para 16 GB GDDR6, o que permite um desempenho em um nível muito superior ao lidar com conjuntos de dados 3D complexos.
Como mencionamos anteriormente, esse aumento significativo no desempenho se deve principalmente ao NVIDIA Ampere, uma arquitetura de última geração que usa o processo personalizado NVIDIA de 8 nm da Samsung. Também é destacado por um multiprocessador de streaming aprimorado, núcleos Ray Tracing de 2ª geração e aceleração de hardware de rastreamento de raios consideravelmente melhor.
Além disso, o Ampere usa Tensor Cores de 3ª geração para melhorar o desempenho de inferência de IA, enquanto o DLSS resulta em desempenho visivelmente melhor em resoluções mais altas. Há muito mais no Ampere e tudo isso simplesmente significa que o RTX A4000 (como o A8000) é um grande avanço na tecnologia de GPU e até mesmo placas de entrada como esta são capazes de mostrar grandes ganhos de desempenho em comparação com a geração anterior. Com este lançamento, a NVIDIA oferece àqueles que não podem pagar por GPUs de estação de trabalho de ponta a oportunidade de acesso a esta impressionante arquitetura.
Então, para quem é o RTX A4000? Engenheiros e arquitetos que usam aplicativos profissionais avançados e não precisam de uma GPU de estação de trabalho de ponta certamente acharão o A4000 a escolha ideal para suas cargas de trabalho. Aqueles que precisam do melhor desempenho possível de sua estação de trabalho (com um orçamento muito maior para inicializar) podem optar pelo carro-chefe da NVIDIA RTX-A6000 e A5000 que fica entre os dois.
Página do produto NVIDIA RTX A4000
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS feed