ArmazenamentoReview.com

Análise da GPU para estação de trabalho NVIDIA RTX PRO 6000: Arquitetura Blackwell e 96 GB para fluxos de trabalho profissionais

Consumidores   ◇  Workstation

Em agosto, a NVIDIA dividiu sua principal oferta de desktop Blackwell em duas categorias para profissionais: Workstation e Server. A placa RTX PRO 6000 Workstation foi projetada para criadores, engenheiros e desenvolvedores de IA que exigem o máximo de computação e VRAM em um gabinete de torre ou desktop. A RTX PRO 6000 Blackwell Server Edition foi projetada para servidores em rack e nós de inferência ou renderização headless em data centers. Agora que temos a placa de workstation em estoque, podemos nos concentrar nela para esta análise.

Vista frontal da Nvidia RTX PRO 6000 com preguiça.

Por US$ 8,500, a RTX PRO 6000 traz um GB202 completo com 24,064 núcleos CUDA, 752 núcleos Tensor de quinta geração, 188 núcleos RT de quarta geração e 96 GB de GDDR7 ECC. O apelo é imediatamente aparente. Você obtém capacidade de memória que placas de vídeo de consumo não conseguem igualar, drivers profissionais e um formato de dois slots que se adapta a estações de trabalho reais sem requisitos especiais de energia ou fluxo de ar.

A NVIDIA posiciona esta GPU para fluxos de trabalho mistos. Isso inclui inferência LLM local com contexto longo, renderização de cenas extensas, simulação complexa e plataformas de pesquisa multi-GPU. A praticidade é fundamental aqui. A placa utiliza uma interface PCIe 5.0 x16 padrão, oferece quatro saídas DisplayPort 2.1b para visualização em alta resolução e alta taxa de atualização e fornece um TDP configurável de 600 W, permitindo que os integradores ajustem para obter a melhor temperatura, acústica ou densidade.

Nosso objetivo é avaliar o desempenho desta versão de estação de trabalho no laboratório em IA, renderização e computação geral, e quantificar o impacto do pool de 96 GB nas capacidades de um único nó de desktop.

NVIDIA RTX PRO 6000 Workstation vs. Edição de Servidor

As variantes da RTX PRO 6000 partem da mesma base Blackwell GB202, então a capacidade matemática bruta parece familiar no papel. A diferença está em como e onde elas devem ser instaladas. A placa de estação de trabalho que estamos testando é uma placa independente, com resfriamento ativo e dois slots, com quatro saídas DisplayPort 2.1b e drivers de nível de estúdio. Ela se encaixa em uma estação de trabalho de torre ou de mesa, controla painéis locais e executa aplicativos DCC e CAD com certificação ISV, juntamente com CUDA, TensorRT e cuDNN. Se os fluxos de trabalho combinam trabalho interativo em viewport, visualização local e IA integrada, este é o caminho que mantém tudo em um único chassi com acústica e térmica previsíveis.

O RTX PRO 6000 Blackwell Server Edition foi projetado para um propósito distintamente diferente. É uma configuração headless, rack-first, destinada a servidores, com fluxo de ar front-to-back e recursos de gerenciamento remoto. Não há saídas de vídeo ativas, pois os trabalhos são agendados pela rede e os resultados são consumidos remotamente. Os perfis de firmware, energia e térmicos são ajustados para operação 24×7 sob um agendador, normalmente emparelhado com NVIDIA AI Enterprise, orquestração de contêineres e passagem de hipervisor. Em suma, o modelo de estação de trabalho é a escolha certa quando criadores e engenheiros precisam ver e manipular o trabalho localmente enquanto também executam grandes lotes de inferência ou simulação. A edição de servidor faz mais sentido ao escalar nós idênticos atrás de uma fila em um data center, onde cada watt, cabo e caminho de fluxo de ar deve caber em um plano de serviço OEM.

Especificações da NVIDIA RTX PRO 6000

A tabela abaixo descreve as especificações da NVIDIA RTX PRO 6000 em comparação com a RTX 5090 e a geração anterior da Ada Lovelace, a RTX 4090.

Comparação de GPU NVIDIA RTX PRO 6000 NVIDIA RTX 5090 NVIDIA RTX 4090
Nome da GPU GB202 GB202 AD102
Plataforma Blackwell 2.0 Blackwell 2.0 Ada Lovelace
Tamanho do Processo 5 nm 5 nm 5 nm
Transistores 92,200 milhões 92,200 milhões 76,300 milhões
Densidade 122.9 M/mm² 122.9 M/mm² 125.3 M/mm²
Tamanho da matriz 750 mm² 750 mm² 609 mm²
Largura do Slot Ranhura dupla Ranhura dupla Slot triplo
Dimensões 304 mm x 137 mm x 40 milímetros 304 mm x 137 mm x 48 milímetros 304 mm x 137 mm x 61 milímetros
TDP 600W 575W 450W
Saídas 4 portas DisplayPort 2.1b 1x HDMI 2.1b,3x DisplayPort 2.1b 1x HDMI 2.1, 3x DisplayPort 1.4a
Conectores de alimentação 1x 16-pin 1x 16-pin 1x 16-pin
Interface de barramento PCIe 5.0 x16 PCIe 5.0 x16 PCIe 4.0 x16
Relógio Base 1590 MHz 2017 MHz 2235 MHz
Boost Clock 2617 MHz 2407 MHz 2520 MHz
Relógio de memória 1750 MHz (28 Gbps efetivo) 2209 MHz (28 Gbps efetivo) 1313 MHz (21 Gbps efetivo)
Tamanho da memória 96 GB 32 GB 24 GB
Tipo de memória GDDR7 ECC GDDR7 GDDR6X
Bus de Memória Pouco 512 Pouco 512 Pouco 384
Largura de banda de memória 1.79 TB / s 1.79 TB / s 1.01 TB / s
Cursos de CUDA 24,064 21,760 16,384
Núcleos Tensores 752 680 512
ROPs 192 192 176
Contagem de SM 188 170 128
RT Núcleos 188 170 128
L1 Cache 128 KB (por SM) 128 KB (por SM) 128 KB (por SM)
L2 Cache 128 MB 88 MB 72 MB
Taxa de pixels 502.5 GPixel / s 462.1 GPixel / s 443.5 GPixel / s
Taxa de textura 1,968.0 GTexel / s 1,637 GTexel / s 1,290 GTexel / s
FP16 (metade) 126.0 TFLOPs (1:1) 104.8 TFLOPs (1:1) 82.58 TFLOPs (1:1)
FP32 (flutuante) 126.0 TFLOPS 104.8 TFLOPS 82.58 TFLOPS
FP64 (duplo) 1.968 TFLOPs (1:64) 1.637 TFLOPs (1:64) 1,290 GFLOPS (1:64)
Preço de lançamento (USD) $8,500 $1,999 $1,599

Construir e projetar

A GPU RTX PRO 6000 Workstation mantém o design limpo e funcional da NVIDIA, como visto na RTX 5090 FE, com acabamento industrial preto fosco e um layout de ventoinha de eixo duplo otimizado para ambientes de estação de trabalho. Cada ventoinha foi projetada para impulsionar o fluxo de ar através da câmara de vapor 3D de comprimento total, ajudando a manter o equilíbrio térmico sob cargas de trabalho contínuas. Medindo 304 mm × 137 mm × 40 mm, ela se encaixa confortavelmente em uma configuração de slot duplo, oferecendo densidade de desempenho excepcional devido ao seu TDP de 600 W.

Vista frontal da Nvidia RTX PRO 6000.

Na borda superior, o PRO 6000 possui um único conector de alimentação de 16 pinos, fornecendo a corrente necessária para suportar seus 96 GB de memória GDDR7 e a arquitetura Blackwell 2.0 completa. A qualidade de construção é premium e rígida, com uma cobertura de alumínio que canaliza o ar de forma eficiente através do conjunto de aletas. A marca discreta da NVIDIA complementa a estética profissional, sem RGB ou detalhes de jogos, enfatizando a confiabilidade e o desempenho em gabinetes de workstation com alta demanda térmica.

Parte superior da Nvidia RTX PRO 6000.

Em termos de E/S, a NVIDIA oferece quatro saídas DisplayPort 2.1b, garantindo compatibilidade com configurações 8K de vários monitores, fluxos de trabalho HDR com precisão de cores e ambientes de renderização avançados. O uso do DisplayPort 2.1b via HDMI reflete sua orientação profissional, com largura de banda aprimorada para telas de alta resolução e alta atualização.

Portas de vídeo Nvidia RTX PRO 6000.

Teste de Desempenho

Para avaliar o desempenho da nossa amostra NVIDIA RTX PRO 6000, comparamos diretamente com as principais concorrentes da NVIDIA para o consumidor, a RTX 5090 Founders Edition e a RTX 4090 Founders Edition. Os testes foram conduzidos com uma combinação de cargas de trabalho profissionais e baseadas em IA para destacar tanto o poder computacional bruto quanto o desempenho de aplicações reais. Os benchmarks incluíram UL Procyon AI Text Generation, UL Procyon AI Image Generation, LuxMark, Geekbench 6 e V-Ray, fornecendo uma visão geral equilibrada do desempenho de renderização, inferência e produtividade.

Além dessas cargas de trabalho padrão, também executamos testes direcionados projetados para mostrar os 96 GB de memória GDDR7 na RTX PRO 6000, demonstrando suas vantagens no manuseio de grandes modelos, conjuntos de dados de alta resolução e cargas de trabalho de visualização profissional onde capacidade e rendimento sustentado são essenciais.

Para aproveitar ao máximo os benefícios da nova NVIDIA RTX PRO 6000, utilizamos nossa plataforma AMD ThreadRipper. Este sistema, conforme configurado, oferece uma CPU de 64 núcleos e um circuito de resfriamento a água. Ele possui bastante potência de CPU subjacente para permitir que a GPU faça seu trabalho sem interrupções. A configuração completa do sistema está listada abaixo.

Plataforma de teste StorageReview AMD ThreadRipper
  • placa-mãe: ASUS Pro WS TRX50-SAGE WI-FI
  • CPU: AMD Ryzen Threadripper 7980X 64 núcleos
  • RAM: 32 GB DDR5 4800 MT/s
  • Armazenamento: Samsung 2 Pro de 980 TB
  • OS: Windows 11 Pro para estações de trabalho

UL Procyon: Geração de texto de IA

O Texto de IA Procyon Generation referência simplifica os testes de desempenho de LLM em IA, fornecendo um método de avaliação conciso e consistente. Permite testes repetidos em múltiplos modelos de LLM, minimizando a complexidade de modelos de grande porte e fatores variáveis. Desenvolvido com líderes em hardware de IA, otimiza o uso de aceleradores de IA locais para avaliações de desempenho mais confiáveis e eficientes. Os resultados medidos abaixo foram testados usando o TensorRT.

Em todos os quatro testes de modelo, a NVIDIA RTX PRO 6000 liderou consistentemente o grupo. Começando com Phi, a PRO 6000 alcançou uma pontuação geral de 6,775, superando a RTX 5090 com 5,749, a RTX 4090 com 4,958 e a RTX 6000 Ada com 4,508. Sua taxa de geração de tokens mais rápida (325.9 tokens/s) e menor latência (0.182 s para o primeiro token) reforçam sua capacidade de resposta em cargas de trabalho de IA baseadas em bate-papo e geração de texto em tempo real.

A tendência continuou com o Mistral, onde o PRO 6000 registrou 7,346, mantendo uma margem substancial sobre o 5090 (6,267), o 4090 (5,094) e o 6000 Ada (4,255). Sua taxa de transferência de 271.8 tokens/s demonstra o benefício de seu pool de memória maior de 96 GB e o ajuste otimizado da estação de trabalho para inferência de alto contexto.

No Llama3, a PRO 6000 permaneceu à frente com uma pontuação de 6,501, em comparação com 6,104 da RTX 5090, 4,849 da 4090 e 4,026 da 6000 Ada. Isso destaca a consistência da arquitetura Blackwell da NVIDIA, com a PRO 6000 mantendo vantagens de desempenho à medida que as cargas de trabalho do transformador aumentam em complexidade e duração do contexto.

Por fim, no Llama2, que enfatiza a inferência de contexto longo e o desempenho sustentado, a PRO 6000 alcançou 8,008, enquanto as GPUs 5090, 4090 e 6000 Ada ficaram atrás, com 6,591, 5,013 e 3,957, respectivamente. Mesmo com o aumento do comprimento das sequências e dos tempos de inferência, a PRO 6000 manteve clara dominância em velocidade e estabilidade, concluindo execuções mais rapidamente e com uma taxa de transferência mais suave do que qualquer outra GPU testada.

UL Procyon: Geração de texto de IA NVIDIA RTX PRO 6000 NVIDIA RTX 5090 NVIDIA RTX 4090 NVIDIA RTX 6000 Ada
Pontuação geral Phi 6,775 5,749 4,958 4,508
Tempo de saída Phi para o primeiro token 0.182 s 0.244 s 0.255 s 0.288 s
Tokens de saída Phi por segundo 325.855 tok/s 314.435 tok/s 244.343 tok/s 228.359 tok/s
Phi Duração Geral 9.498 s 10.280 s 12.872 s 13.869 s
Mistral Pontuação Geral 7,346 6,267 5,094 4,255
Tempo de saída do Mistral para o primeiro token 0.229 s 0.297 s 0.322 s 0.419 s
Tokens de saída Mistral por segundo 271.779 tok/s 255.945 tok/s 183.266 tok/s 166.633 tok/s
Mistral Duração total 11.493 s 12.593 s 17.010 s 19.092 s
Pontuação geral do Llama3 6,501 6,104 4,849 4,026
Tempo de saída do Llama3 para o primeiro token 0.218 s 0.234 s 0.259 s 0.348 s
Tokens de saída Llama3 por segundo 226.407 tok/s 214.285 tok/s 150.039 tok/s 138.620 tok/s
Llama3 Duração total 13.554 s 14.304 s 19.991 s 22.062 s
Pontuação geral do Llama2 8,008 6,591 5,013 3,957
Tempo de saída do Llama2 para o primeiro token 0.307 s 0.419 s 0.500 s 0.679 s
Tokens de saída Llama2 por segundo 145.595 tok/s 134.502 tok/s 92.853 tok/s 78.532 tok/s
Llama2 Duração total 20.712 s 23.018 s 32.448 s 38.923 s

UL Procyon: Geração de imagem AI

O Benchmark de geração de imagens de IA da Procyon fornece um método consistente e preciso para medir o desempenho de inferência de IA em diversos hardwares, desde NPUs de baixo consumo até GPUs de ponta. Inclui três testes: Stable Diffusion XL (FP16) para GPUs de ponta, Stable Diffusion 1.5 (FP16) para GPUs moderadamente potentes e Stable Diffusion 1.5 (INT8) para dispositivos de baixo consumo. O benchmark utiliza o mecanismo de inferência ideal para cada sistema, garantindo resultados justos e comparáveis.

Começando com o Stable Diffusion 1.5 (FP16), a NVIDIA RTX PRO 6000 apresentou uma impressionante pontuação geral de 8,869, superando a RTX 5090 com 8,193, a RTX 4090 com 5,260 e a RTX 6000 Ada com 4,230. A PRO 6000 concluiu a geração de imagens em 11.27 segundos, com uma média de 0.705 segundos por imagem, tornando-a a mais rápida neste teste. Isso demonstra como seu ajuste otimizado para estações de trabalho e 96 GB de memória GDDR7 permitem uma saída sustentada e de alta precisão sem comprometer a eficiência.

No teste Stable Diffusion 1.5 (INT8), que mede o desempenho de inferência quantizada leve, todas as GPUs apresentaram desempenho semelhante. A PRO 6000 obteve 79,064 pontos, quase idêntica à RTX 5090, com 79,272, enquanto superou a RTX 4090 (62,160) e a RTX 6000 Ada (55,901). Como as cargas de trabalho do INT8 dependem menos da largura de banda e da capacidade da memória, as diferenças foram mínimas, mas a PRO 6000 manteve resultados consistentes com um tempo médio de geração de 0.395 segundos por imagem.

O teste Stable Diffusion XL (FP16) exige muito das GPUs com execuções de inferência mais longas e exigentes, que exigem tanto a memória quanto a taxa de transferência de dados sustentada. Aqui, a PRO 6000 alcançou uma pontuação geral de 6,991, ficando logo atrás dos 7,179 da RTX 5090, mas bem à frente dos 5,025 da RTX 4090 e dos 3,043 da RTX 6000 Ada. Ela manteve um tempo total de renderização de 85.8 segundos, ou 5.36 segundos por imagem, mostrando que a PRO 6000 lida com cargas de trabalho de geração estendida de forma eficiente e sem lentidão.

UL Procyon: Geração de imagens de IA NVIDIA RTX PRO 6000 NVIDIA RTX 5090 NVIDIA RTX 4090 NVIDIA RTX 6000 Ada
Difusão Estável 1.5 (FP16) – Pontuação Geral 8,869 8,193 5,260 4,230
Difusão Estável 1.5 (FP16) – Tempo Geral 11.274 s 12.204 s 19.011 s 23.639 s
Difusão Estável 1.5 (FP16) – Velocidade de Geração de Imagem 0.705 s/image 0.763 s/image 1.188 s/image 1.477 s/image
Difusão Estável 1.5 (INT8) – Pontuação Geral 79,064 79,272 62,160 55,901
Difusão Estável 1.5 (INT8) – Tempo Geral 3.162 s 3.154 s 4.022 s 4.472 s
Difusão Estável 1.5 (INT8) – Velocidade de Geração de Imagem 0.395 s/image 0.394 s/image 0.503 s/image 0.559 s/image
Difusão Estável XL (FP16) – Pontuação Geral 6,991 7,179 5,025 3,043
Difusão Estável XL (FP16) – Tempo Geral 85.819 s 83.573 s 119.379 s 197.172 s
Stable Diffusion XL (FP16) – Velocidade de geração de imagem 5.364 s/image 5.223 s/image 7.461 s/image 12.323 s/image

Blender 4.4

O Blender é um aplicativo de modelagem 3D de código aberto. Este benchmark foi executado usando o utilitário Blender Benchmark. A pontuação é medida em amostras por minuto, com valores mais altos indicando melhor desempenho.

Em todos os três cenários, a NVIDIA RTX PRO 6000 conquistou a primeira posição, demonstrando os benefícios de sua arquitetura Blackwell e capacidade de memória expandida. No cenário Monster, a PRO 6000 obteve 7,870.17 amostras por minuto, à frente da RTX 5090 com 7,421.50, enquanto a RTX 4090 e a RTX 6000 Ada seguiram com 5,733.97 e 5,632.60, respectivamente.

No cenário de Junkshop, a PRO 6000 manteve a liderança com 4,158.91 amostras por minuto, em comparação com 3,980.15 da RTX 5090, 2,827.83 da RTX 4090 e 2,663.77 da RTX 6000 Ada. Por fim, no cenário de Sala de Aula, que tende a enfatizar tanto o sombreamento quanto a eficiência da memória, a PRO 6000 atingiu 4,041.11 amostras por minuto, mais uma vez à frente das 3,732.63 da RTX 5090 e superando significativamente a RTX 4090 e a RTX 6000 Ada, com 2,909.35 e 2,818.83, respectivamente.

Blender 4.4 (quanto maior, melhor) NVIDIA RTX PRO 6000 NVIDIA RTX 5090 NVIDIA RTX 4090 NVIDIA RTX 6000 Ada
Monstro 7,870.17 7,421.50 5,733.97 5,632.60
sucata 4,158.91 3,980.15 2,827.83 2,663.77
Sala de aula 4,041.11 3,732.63 2,909.35 2,818.83

Luxmark

O Luxmark é um benchmark de GPU que utiliza o LuxRender, um renderizador de ray tracing de código aberto, para avaliar o desempenho de um sistema ao lidar com cenas 3D altamente detalhadas. Este benchmark é particularmente relevante para avaliar as capacidades de renderização gráfica de servidores e estações de trabalho, especialmente em aplicações de efeitos visuais e visualização arquitetônica, onde a simulação precisa da luz é crucial.

No teste de cena de alimentos, a NVIDIA RTX PRO 6000 liderou com uma pontuação de 24,287, superando a RTX 5090 com 23,141, enquanto a RTX 4090 e a RTX 6000 Ada ficaram em segundo lugar, com 17,171 e 14,873, respectivamente. Isso demonstra como a PRO 6000 mantém um desempenho de ray tracing suave em cargas de trabalho com geometria e iluminação altamente detalhadas, sem perda de estabilidade ou limitação térmica.

No cenário mais exigente do Hall, que enfatiza geometria em grande escala e iluminação global complexa, o PRO 6000 garantiu novamente o melhor resultado com 52,588, pouco à frente dos 51,725 do RTX 5090 e bem acima do RTX 4090 (38,887) e do RTX 6000 Ada (32,132).

Luxmark (quanto maior, melhor) NVIDIA RTX PRO 6000 NVIDIA RTX 5090 NVIDIA RTX 4090 NVIDIA RTX 6000 Ada
Pontuação Alimentar 24,287 23,141 17,171 14,873
Pontuação do Hall 52,588 51,725 38,887 32,132

Geekbench 6

Geekbench 6 é um benchmark multiplataforma que mede o desempenho geral do sistema. O Geekbench Browser permite que você compare qualquer sistema a ele.

Neste teste, a NVIDIA RTX PRO 6000 alcançou uma pontuação GPU OpenCL de 384,158, superando a RTX 5090 (374,807), a RTX 4090 (333,384) e a RTX 6000 Ada (336,882). A pontuação mais alta da PRO 6000 reflete seu design otimizado para estação de trabalho, largura de banda de memória aprimorada e conjunto de drivers profissional, que juntos permitem um desempenho consistente em uma ampla gama de cargas de trabalho computacionais pesadas.

Geekbench (quanto maior, melhor) NVIDIA RTX PRO 6000 NVIDIA RTX 5090 NVIDIA RTX 4090 NVIDIA RTX 6000 Ada
Pontuação OpenCL da GPU 384,158 374,807 333,384 336,882

V-Ray

V-Ray O Benchmark mede o desempenho de renderização de CPUs, GPUs NVIDIA ou ambos, usando mecanismos avançados do V-Ray 6. Ele utiliza testes rápidos e um sistema de pontuação simples para permitir que os usuários avaliem e comparem as capacidades de renderização de seus sistemas. É uma ferramenta essencial para profissionais que buscam insights de desempenho eficientes.

Em nossos testes, a NVIDIA RTX PRO 6000 obteve 12,128 vpaths, ficando entre a RTX 5090, que liderou com 14,764, e a RTX 4090, que obteve 10,847. A RTX 6000 Ada ficou ligeiramente atrás, com 10,766. Enquanto a RTX 5090 manteve uma ligeira vantagem neste teste de renderização com uso intensivo de GPU, a PRO 6000 demonstrou desempenho forte e consistente, reforçando seu ajuste voltado para estações de trabalho e eficiência sustentada sob cargas de renderização máximas.

V-Ray (quanto maior, melhor) NVIDIA RTX PRO 6000 NVIDIA RTX 5090 NVIDIA RTX 4090 NVIDIA RTX 6000 Ada
caminhos v 12,128 14,764 10,847 10,766

Teste de inferência multimodelo do LM Studio

Nesta rodada de testes, usamos o LM Studio para avaliar o desempenho da NVIDIA RTX PRO 6000 em uma variedade de modelos populares de linguagem de programação, incluindo GPT-OSS 120B, Gemma 3 (4B, 12B e 27B), Llama 3.1 (8B e 70B) e Llama 3.3 70B. Cada modelo recebeu a mesma instrução:

“Escreva um artigo acadêmico de 500 palavras sobre a história das preguiças.”

O foco principal neste teste está em Tokens por Segundo (taxa de transferência) e Tempo Total (duração da conclusão), que juntos destacam a eficiência com que o RTX PRO 6000 lida com diferentes tamanhos e complexidades de modelos sob condições de geração idênticas.

Nos testes de inferência do LM Studio, a NVIDIA RTX PRO 6000 demonstrou excelente desempenho e escalabilidade em uma ampla variedade de tamanhos de modelos, desde modelos menores de 4B parâmetros até configurações massivas de 120B.

O destaque deste teste foi o OpenAI GPT-OSS 120B, onde a RTX PRO 6000 produziu 163.1 tokens por segundo e completou a geração de 500 palavras em 9.54 segundos. Este resultado se destaca porque placas como a RTX 5090 não conseguem carregar ou executar um modelo de 120B e frequentemente falham até mesmo em modelos de 70B devido à VRAM limitada. Os 96 GB de memória GDDR7 da PRO 6000 permitem que ela processe esses modelos enormes localmente, tornando-a excepcionalmente capaz entre as GPUs para estações de trabalho.

Entre os modelos menores, o Gemma 3.4 B alcançou a maior taxa de transferência, concluindo a tarefa a 226.7 tokens por segundo em 3.51 segundos. O Llama 3.1 8B Instruct ficou logo atrás, com 197.1 tokens por segundo e um tempo total de 4.17 segundos. Essas execuções demonstram a alta eficiência e a resposta rápida do PRO 6000 em cargas de trabalho de inferência de médio porte.

Na extremidade superior, os modelos Llama 3.1 70B Instruct e Llama 3.3 70B tiveram uma média de cerca de 31.8 tokens por segundo, com tempos totais de geração de 27.2 segundos e 25.3 segundos, mostrando uma saída consistente apesar de seu grande tamanho.

No geral, a RTX PRO 6000 oferece excelente estabilidade, rendimento e capacidade ao executar modelos em larga escala. Sua capacidade de memória de 96 GB permite lidar com cargas de trabalho que excedem os limites das GPUs de consumo, tornando-a uma excelente escolha para desenvolvedores, pesquisadores e profissionais que precisam de desempenho local confiável para IA avançada e desenvolvimento de modelos generativos.

LM Studio (Resultados de Inferência de Modelo)
Nome do modelo Tokens / Seg Tempo para o primeiro token(s) Tempo(s) total(is) Tokens de prompt Tokens previstos Tokens totais
OpenAI GPT-OSS 120B 163.15 0.193 9.543 81 1,557 1,638
Gema 3 4B 226.73 0.113 3.51 25 796 821
Gema 3 12B 117.15 0.068 8.06 25 944 969
Gema 3 27B 68.06 0.221 12.048 25 820 845
Meta Llama 3.1 8B Instruir 197.07 0.062 4.171 49 822 871
Meta Llama 3.1 70B Instruir 31.84 0.159 27.227 49 867 916
Meta Lhama 3.3 70B 31.74 0.323 25.329 49 804 853

Consumo de energia da NVIDIA RTX PRO 6000

Para avaliar a eficiência real das cargas de trabalho de IA, utilizamos o benchmark UL Procyon AI Image Generation, especificamente o teste Stable Diffusion XL FP16. Este teste se concentra no intervalo entre a segunda e a última imagem gerada, capturando o tempo necessário para concluir o intervalo, o consumo de energia de pico e sustentado e a energia ociosa do sistema após a conclusão.

Durante nossos testes, a RTX PRO 6000 manteve um consumo médio de 918.5 W sob carga contínua, com pico de 1,036.3 W, com consumo ocioso de 152.3 W após a conclusão da carga de trabalho. O intervalo completo do teste durou 5.3 segundos, consumindo um total de 1.35 Wh de energia. Esses resultados demonstram excelente relação potência/desempenho para uma GPU de nível de estação de trabalho, mantendo o consumo bem controlado e mantendo alta produtividade durante cargas de trabalho de inferência prolongadas.

Comparada a outras GPUs, a RTX PRO 6000 se aproxima da RTX 4090 em consumo total de energia, mantendo um tempo de conclusão mais rápido, e supera significativamente a RTX 6000 Ada em eficiência energética e velocidade. Curiosamente, as novas placas Blackwell, que compartilham o chip GB202, apresentam características de eficiência muito semelhantes sob esta carga de trabalho, com apenas pequenas diferenças no consumo total de energia, provavelmente devido ao maior TDP da PRO 6000. Isso indica que a última geração da NVIDIA continua a refinar o desempenho por watt, em vez de alterá-lo drasticamente.

Potência de imagem usada do Stable Diffusion XL FP16 (quanto menor, melhor) NVIDIA RTX PRO 6000 NVIDIA RTX 5090 NVIDIA RTX 4090 NVIDIA RTX 6000 Ada
Energia consumida 1.35Wh 1.16Wh 1.35Wh 1.76Wh
Duração do teste 5.3s 5.1s  7.3s 12.6s

Conclusão

A NVIDIA RTX PRO 6000 é, em conjunto, a GPU de estação de trabalho mais capaz disponível para fluxos de trabalho profissionais, oferecendo desempenho de nível de data center em um formato de mesa. Com preço de varejo em torno de US$ 8,500 no momento dos testes, ela é voltada para equipes que exigem confiabilidade, alta densidade computacional e um enorme pool de memória ECC para trabalho de produção. Com 24,064 núcleos CUDA, 752 núcleos Tensor, 96 GB de GDDR7 ECC e arquitetura Blackwell, ela lida com cargas de trabalho que excedem os limites práticos de placas de vídeo para consumidores como a GeForce RTX 5090 ou 4090. Benchmarks individuais podem mostrar uma placa de vídeo para consumidores superando-a em velocidade bruta, mas, considerando como um todo a capacidade, estabilidade, drivers e suporte ISV, a RTX PRO 6000 é a mais adequada para uso profissional.

Para IA e ML, o pool de 96 GB é o destaque. Ele permite inferência de contexto longo e pontos de verificação muito grandes localmente, o que demonstramos executando modelos de classe de 70 a 120 bilhões, mantendo tokens fortes por segundo. A renderização e a simulação também se beneficiam do cache L2 e da largura de banda de memória maiores, proporcionando desempenho previsível e sustentado no Blender, V-Ray e LuxMark sob cargas prolongadas.

Vista frontal da Nvidia RTX PRO 6000.

A placa é compatível com estações de trabalho reais. Ela apresenta um design dual-slot com interface PCIe 5.0 x16, quatro saídas DisplayPort 2.1b e uma única entrada de alimentação de 16 pinos. Considere uma fonte de alimentação de qualidade e fluxo de ar no chassi para suportar a potência de 600 W da placa. A compatibilidade com múltiplas GPUs também é simples, com suporte OEM e ISV para 2 a 8 GPUs em pilhas de IA, renderização e computação.

Se seu trabalho envolve LLMs de contexto longo, cenas muito grandes ou simulação de alta precisão em um único nó, a RTX PRO 6000 justifica seu prêmio com capacidade e consistência que outras placas não conseguem igualar.

Página do produto Nvidia RTX PRO 6000

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram: | Twitter | TikTok | RSS feed

Dylan Dougherty

Administrador de rede K-12 com experiência em redes Cisco, segurança IP e soluções NAC. Entusiasta de UniFi e labber doméstico, testando e revisando produtos de rede e segurança.