As novas GPUs baseadas em Ampere da NVIDIA estão aqui e, se você tiver sorte, poderá comprar uma. No momento em que este artigo foi escrito em fevereiro de 2021, o estoque de novas GPUs ainda é extremamente escasso e não deve voltar ao normal até pelo menos o terceiro trimestre deste ano. Mas você está realmente perdendo muito se não conseguir colocar as mãos em uma nova NVIDIA GeForce RTX 3 para sua estação de trabalho? Existem, é claro, muitos fatores para saber se você precisa atualizar.
As novas GPUs baseadas em Ampere da NVIDIA estão aqui e, se você tiver sorte, poderá comprar uma. No momento em que este artigo foi escrito em fevereiro de 2021, o estoque de novas GPUs ainda é extremamente escasso e não deve voltar ao normal até pelo menos o terceiro trimestre deste ano. Mas você está realmente perdendo muito se não conseguir colocar as mãos em uma nova NVIDIA GeForce RTX 3 para sua estação de trabalho? Existem, é claro, muitos fatores para saber se você precisa atualizar.
Hoje vamos dar uma olhada em uma série de casos de uso para esclarecer se a espera valerá a pena. Veremos casos de uso profissionais criativos, coisas como Blender, Davinci Resolve e LuxMark, mas também veremos um benchmark de aprendizado de máquina baseado na biblioteca TensorFlow de código aberto em Python e um pouco de jogos para boa medida. Estaremos comparando uma NVIDIA GeForce RTX 3090 Founder's Edition com a NVIDIA Quadro RTX 8000, o (antigo) rei da linha de estações de trabalho da NVIDIA. Embora uma comparação mais adequada seja com a Quadro RTX 6000, já que ambas as placas têm 24 GB de VRAM, os resultados seriam quase idênticos, pois os recursos reais de computação da 8000 e da 6000 são os mesmos e nenhum desses benchmarks usou mais de 24 GB de VRAM. Também temos algumas estações de trabalho OEM para comparação, incluindo uma Lenovo P920 que analisamos anteriormente com RTX 8000 duplo e um novo Lenovo P620 embalado com o mais recente Threadripper PRO da AMD.
Por que estamos comparando uma placa Quadro de estação de trabalho com uma placa GeForce de consumo? Porque nunca antes a NVIDIA lançou um cartão de consumidor tão poderoso, e a proposta de valor de gastar um terço do dinheiro em comparação com a linha Quadro tornou-se muito atraente. Principalmente porque, no momento em que escrevo este artigo, não há nenhuma palavra oficial sobre um verdadeiro sucessor do TITAN RTX, que tradicionalmente preenche o nicho de GPUs de trabalho e lazer. Também é impossível ignorar o estado do mundo agora, com soluções de trabalho em casa sendo uma prioridade para muitas pessoas, e ter uma GPU extremamente poderosa para CAD durante o dia e jogos à noite soa melhor do que nunca. Nós sabemos, podemos ouvi-lo através da tela sobre as diferenças para uma placa de estação de trabalho “verdadeira”! Chegaremos lá, prometemos; continue lendo.
O sistema de teste principal e as especificações da GPU estão abaixo, incluindo as versões do driver e do BIOS.
OS | Windows 10 Professional (ver 20H2, outubro de 2020) |
CPU | AMD Ryzen 9 3900X |
Memória | 4x8GB (32GB) G.Skill TridentZ Neo 3600MHz CL16 |
test drive | Samsung 2 Pro de 970 TB |
motherboard | ASRock X570 Taichi (BIOS v4.00, PCIe Gen4) |
GPU1 | NVIDIA RTX 3090 Founder's Edition (Studio Driver 461.40) |
GPU2 | NVIDIA Quadro RTX 8000 (driver de filial de produção R460 U3, 461.40) |
Quadro RTX 8000 | RTX 3090 FE | |
Arquitetura | Turing (12nm) | Ampère (8nm) |
Cursos de CUDA | 4,608 | 10,496 |
Núcleos Tensores | 576 (2ª Geração) | 328 (3ª Geração) |
RT Núcleos | 72 (1ª Geração) | 82 (2ª Geração) |
Memória GPU | 48 GB GDDR6 com ECC | 24GB GDDR6X |
Desempenho FP32 | 16.3 TFLOPS | 35.6 TFLOPS |
Consumo de energia | 295W | 350W |
Interface PCIe | PCIe 3.0 x16 | PCIe 4.0 x16 |
Cooler | estilo soprador | Fluir através |
Suporte multi-GPU NVLink | Sim | Sim |
Suporte SR-IOV | Sim | Não |
GeForce RTX 3090 vs Quadro RTX 8000 Benchmarks
Vamos começar com jogos. Isso pode parecer uma coisa estranha para incluir em um artigo sobre gráficos de estação de trabalho, mas com tantas pessoas trabalhando em casa hoje em dia, não é razoável esperar que muitos profissionais terminem seu trabalho e comecem a jogar na mesma máquina. Testamos Cyberpunk 2077, Shadow of the Tomb Raider e Borderlands 3. Borderlands e Tomb Raider têm ferramentas de benchmark integradas e, embora Cyberpunk não tenha, sentimos que podíamos registrar uma boa quantidade de dados entre os dois cartões para dar uma média. Todos os testes foram feitos em 1440p; Borderlands foi definido para todas as configurações máximas, exceto desfoque de movimento; Tomb Raider foi definido como máximo, RTX Ultra e sem DLSS; e o Cyberpunk 2077 foi definido como RTX Medium Preset, com DLSS definido como Quality. Títulos de e-sports como League of Legends e CS:GO manterão facilmente mais de 250 FPS com qualquer um desses cartões, então eles não foram testados completamente. Curiosamente, vimos bem mais de 150 FPS consistentemente com ambas as placas em Call of Duty: Warzone, mas não o testamos completamente o suficiente para considerá-lo um verdadeiro benchmark para incluir neste gráfico.
Para a surpresa de ninguém, o RTX 3090 é a melhor GPU para jogos do mercado no momento e, embora o AMD Radeon 6900XT vá bater em cheio com ele em certos títulos, quando se trata de traçado de raios, o 3090 não tem concorrência. . Cyberpunk 2077, ame ou odeie, é o título mais exigente disponível no momento e em todos os nossos testes, o RTX 3090 manteve pelo menos 65 FPS, mesmo em cenas muito movimentadas, e na maioria das vezes o FPS estava no alto 70 e menos de 80 com tempos de quadro consistentemente baixos. É seguro dizer que qualquer coisa menos exigente pode ser executada facilmente em configurações máximas e manter altas taxas de quadros. Lembre-se também de que esses testes foram feitos em fevereiro de 2021, antes de a NVIDIA lançar o suporte de BAR redimensionável para placas GeForce. Esse padrão PCIe, comercializado como Smart Access Memory nas novas placas da AMD, permitirá que as CPUs acessem diretamente toda a VRAM de uma só vez e melhorem o desempenho nos jogos. Os primeiros resultados mostram um ganho de 2% a 5% no FPS, dependendo do jogo. BAR redimensionável provavelmente não aumentará o desempenho em tarefas de computação e, como tal, provavelmente não chegará à linha Quadro tão cedo.
O resultado mais interessante aqui é a competência de uma placa de jogo da Quadro RTX 8000. Embora não pareça uma surpresa devido ao seu poder bruto, seu design e drivers não foram otimizados para jogos, mas em todos, exceto no Cyberpunk 2077, ele mantém bem mais de 60 FPS. Cyberpunk foi instável na melhor das hipóteses, mas discar de volta o traçado de raios e definir DLSS para Desempenho melhorou muito os resultados, mantendo mais de 60 FPS em todas as cenas, exceto nas mais exigentes. Vale a pena notar que encontramos muitos bugs relacionados ao traçado de raios ao executar o Cyberpunk no Quadro, particularmente um problema em que os reflexos desapareciam completamente e as cenas ficavam escuras. Isso não aconteceu no RTX 3090, então vamos atribuir isso a um problema relacionado ao driver Quadro e ao notório buginess do Cyberpunk.
Shadow of the Tomb Raider na GeForce RTX 3090, 1440p com RTX ativado e DLSS desativado.
A seguir estão as coisas boas; os resultados da estação de trabalho que você espera ver. Este lote de benchmarks observará o desempenho em modelagem 3D, iluminação e trabalho de vídeo. Começaremos com LuxMark, um utilitário de benchmarking de GPU OpenCL. Usamos a versão mais recente, v4alpha0, bem como a v3 mais antiga com o clássico LuxBall.
Dizer que o RTX 3090 tem um desempenho impressionante seria um eufemismo. Em aplicativos fortemente vinculados à GPU, a nova arquitetura Ampere realmente flexiona seus músculos, superando até mesmo o Lenovo P920 e seus RTX 8000s duplos. No LuxMark v3, o desempenho dobrou e os benchmarks v4 aproximavam-se de 150% de desempenho. Espere ver muito mais gráficos parecidos com este, mas (alerta de spoiler) nem tudo é tão claro quanto parece.
Em seguida, vamos dar uma olhada no V-Ray do Chaos Group. Este benchmark é para o conjunto de ferramentas de renderização e simulação V-Ray 3D, que está disponível como um plug-in para uma ampla gama de aplicativos de modelagem 3D, como Cinema 4D, Maya, Rhino e Unreal, entre outros. Este benchmark se concentra especificamente no desempenho de CUDA e RTX. Usamos a versão mais recente do benchmark V-Ray (v5) e também uma mais antiga (v4), apenas para comparação.
A história aqui é muito semelhante ao LuxMark com o RTX 3090 superando amplamente o RTX 8000 e até mesmo ficando acima do Lenovo P920 e suas GPUs duplas. Esse benchmark nos permite ver especificamente as grandes melhorias que a NVIDIA fez em seus núcleos de ray tracing de segunda geração; o desempenho CUDA é quase o dobro, enquanto o desempenho RTX é quase 2%.
O próximo é o onipresente Blender, um aplicativo de modelagem 3D de código aberto. Este benchmark foi executado usando o utilitário Blender Benchmark. NVIDIA OptiX foi o método de renderização escolhido, ao contrário de CUDA, pois todos esses sistemas podem utilizar RTX.
A história é praticamente a mesma mais uma vez, com os núcleos RTX de última geração fazendo um trabalho rápido nas renderizações do Blender, até mesmo queimando a renderização da BMW em menos de 10 segundos. Essa história continua, mas não se preocupe, vai ficar muito interessante em breve. Aqui vemos o OctaneBench, um utilitário de benchmarking para OctaneRender, outro renderizador 3D com suporte a RTX, semelhante ao V-Ray.
Sim. A seguir, veremos os aplicativos de edição de vídeo, especificamente o Davinci Resolve Studio 16.2.8 e o Adobe Premiere Pro 2020. Usaremos o PugetBench for Adobe CC e o PugetBench for Resolve, ambos desenvolvidos por PugetSystems, um fabricante de PCs que fabrica estações de trabalho profissionais para aplicações específicas. Este gráfico analisa especificamente a pontuação de GPU do benchmark geral, pontuando o desempenho em efeitos acelerados de GPU.
Por fim, temos alguns casos de uso em que a proposta de valor cai um pouco. Aplicativos como o Premiere Pro e o Davinci Resolve variam muito em suas necessidades de desempenho, dependendo do projeto e dos efeitos, e geralmente apresentam gargalos de CPU. Há uma melhoria, especialmente no Resolve, que tem uma otimização de GPU muito melhor, mas os usuários do pacote Adobe Creative Cloud encontrarão mais valor em placas GeForce de baixo custo, como o RTX 3080, onde você obterá ostensivamente 90% do desempenho por 46 % do preço (com base no MSRP dos cartões Founder's Edition). Embora não relatado aqui, o desempenho no After Effects e no Photoshop foi semelhante, onde a maioria dos testes foi limitada pela CPU. Também vale a pena notar que as placas Quadro e GeForce usam a versão de 7ª geração do NVENC (o codificador NVIDIA), portanto, os tempos de renderização H.264 e HEVC serão semelhantes. Lembre-se de que as placas GeForce são limitadas a 3 tarefas de codificação simultâneas (para coisas como streaming e gravação), enquanto as Quadros não têm esse limite. Estamos cientes dos desvios para esse limite, mas abordaremos isso mais tarde. O RTX 3090 usa uma nova geração do NVDEC (descodificador NVIDIA), portanto, haverá melhorias marginais na limpeza da linha do tempo ao trabalhar com gravação HEVC e H.264.
Vamos passar da aplicação criativa para algo novo. Vamos dar uma olhada no desempenho de aprendizado de máquina dessas placas usando um benchmark chamado AI-Benchmark. É uma biblioteca Python de código aberto que executa uma série de testes de aprendizado profundo usando a biblioteca de aprendizado de máquina TensorFlow. Você pode saber mais sobre isso aqui bem como quais metodologias de teste específicas ele usa.
Seus suspiros coletivos foram ouvidos. É a mesma história aqui da maioria dos benchmarks criativos, com a placa GeForce dobrando ostensivamente o desempenho do Quadro. Este teste foi feito no Windows 10, mas você pode esperar resultados semelhantes na distribuição Linux de sua escolha. No momento do teste, o TensorFlow não foi atualizado para oferecer suporte aos novos cartões Ampere, mas com um pouco de hackery, conseguimos fazê-lo funcionar misturando e combinando componentes de diferentes kits de desenvolvedor CUDA. Esperamos que uma versão devidamente atualizada no futuro só possa melhorar os resultados.
Por último, mas definitivamente não menos importante, veremos o SPECviewperf 2020, a mais nova revisão do utilitário de benchmarking padrão do setor da Standard Performance Evaluation Corporation. Este benchmark analisa o desempenho gráfico em uma variedade de aplicativos profissionais. Também incluímos o Lenovo P620 equipado com um Quadro P6000 mais antigo para comparação.
É onde as coisas começam a ficar interessantes. Os resultados da modelagem 3D são quase o que você esperaria, com o RTX 3090 superando o RTX 8000 por uma margem saudável, mas aplicativos como CATIA e Creo, e os testes de energia e médicos, na verdade têm o 3090 com desempenho inferior por um pequeno, mas significativo margem. Ele ainda teve um desempenho inferior ao Quadro P6000 significativamente mais antigo em nosso Lenovo P620. Mas e o Siemens NX? Este é o cerne da situação estação de trabalho versus consumidor, Quadro versus GeForce. Você está lendo o gráfico corretamente; o 3090 marcou 25.37 no Siemens NX. Executamos este teste sete vezes e referenciamos outros resultados de benchmarking na internet e este resultado está absolutamente correto. O RTX 3090 teve menos de 5% do desempenho do Lenovo P620 com o RTX 8000 neste teste. Vamos explorar isso mais na próxima seção.
Estação de trabalho versus GPUs de consumo; Os motoristas
A GeForce RTX 3090 é uma GPU muito poderosa, não há como negar isso, e a Quadro RTX 8000 também é uma GPU poderosa, mas onde eles diferem é importante. A RTX 3090 é antes de tudo uma placa de vídeo para jogos. Ela foi projetada e é comercializada como a melhor GPU absoluta para jogos e a “primeira placa de jogos compatível com 8K do mundo”. O fato de poder superar o RTX 8000 em uma infinidade de tarefas, com margens extremas na maioria dos casos, é uma prova de sua força bruta, essencialmente força bruta em seus testes. A Quadro RTX 8000 é, acima de tudo, uma placa de estação de trabalho, projetada para ser colocada em estações de trabalho, amontoada em servidores montados em rack, conectada por NVLink, virtualizada, executada com força e guardada (metaforicamente, é claro) e sobreviver.
Então, isso levanta a questão: por que a GeForce RTX 3090 teve desempenho inferior ao Quadro RTX 3 de 8000 anos em certas tarefas e até mesmo desempenho inferior ao Quadro P6 de quase 6000 anos? Especificamente, por que o RTX 8000 vê uma ordem de magnitude a mais de desempenho no Siemens NX? Temos certeza que você, leitor experiente, já sabe; tudo se resume a otimizações de driver. A NVIDIA é juíza, júri e carrasco quando se trata de quais GPUs obtêm otimizações de estação de trabalho e é claro que eles não queriam que o RTX 3090 fosse capaz de limpar completamente o piso de sua linha Quadro anterior em todos os aplicativos. Muitos compradores em potencial ficarão muito desapontados ao ver que suas esperanças de desempenho de estação de trabalho de primeira linha durante o dia e jogos sofisticados à noite não são possíveis, pelo menos não no preço sugerido de $ 3090 do RTX 1,499. “Bem, é para isso que serve a linha TITAN”, ouvimos você dizer, mas não há nenhum substituto TITAN RTX disponível no momento, e o preço do 3090 certamente o posiciona como um substituto TITAN. A NVIDIA ainda ostenta o 3090 como tendo “desempenho de classe TITAN” na primeira linha de seus materiais de marketing, mas o resultado do Siemens NX está longe de ser “classe TITAN”. O 3090 é apenas um 3080 superfaturado e superfaturado? Bem, não exatamente. Ainda é a melhor GPU disponível para modeladores 3D e trabalho de vídeo, especialmente com seus 24 GB de VRAM que permitem que os criativos trabalhem com modelos grandes e filmagens de 8K com facilidade, mas isso o coloca em um nicho bem pequeno, um nicho anteriormente atendido pelo TITAN -cartões de classe. Se você não trabalha com aplicativos de CAD como Siemens NX, Creo ou CATIA, o RTX 3090 ainda é atraente, mas é um obstáculo absoluto se esses aplicativos forem essenciais para o seu fluxo de trabalho.
Há outras considerações também. Embora as placas Quadro e GeForce ofereçam configurações multi-GPU em NVLink, e vale a pena notar que apenas a 3090 tem essa capacidade entre as placas da série 3000, apenas a Quadro pode ser virtualizada com SR-IOV. Se sua carga de trabalho envolve a distribuição de uma GPU ou duas GPUs NVLinked para várias VMs, o Quadro ainda é sua única opção. Embora existam maneiras de contornar isso, o ponto ainda é que esse recurso é artificialmente limitado pelo driver GeForce da NVIDIA. O mesmo driver que, aliás, oferece certificações para alguns aplicativos criativos como Adobe suite e Autodesk, bem como certificação WHQL (Windows Hardware Quality Labs) em sua variante Studio, confundindo ainda mais o ponto. Embora prevejamos um verdadeiro substituto do TITAN baseado em Ampere para vir no futuro da NVIDIA, as limitações artificiais impostas à GeForce RTX 3090, incluindo o limite para codificações simultâneas com NVENC, parecem fora de contato com o que os usuários profissionais estão procurando agora. .
Ao escrever este artigo, a NVIDIA também anunciou sua nova linha de GPUs específicas para mineração de criptomoeda e sua intenção de reduzir pela metade o desempenho de mineração do próximo RTX 3060. que estamos simplesmente à mercê de qualquer coisa que a NVIDIA considere digna de ser feita por nossas placas. Esse limite “inacessível” no 3060 será explorado? Sem dúvida, da mesma forma que o limite NVENC foi superado. Mas, por enquanto, a NVIDIA detém todas as placas e para muitos fluxos de trabalho profissionais altamente otimizados para CUDA, RTX, TensorFlow e outras plataformas de computação específicas da NVIDIA, simplesmente não há outra escolha a não ser a NVIDIA.
Conclusão
Vamos decompô-lo um pouco. Você deve manter seus alertas de estoque ativados para o RTX 3090? Enfrente as filas fora do seu MicroCenter local para ter a chance de conseguir um? Como na maioria das coisas, a resposta é “depende”.
- Você trabalha exclusivamente com grandes modelos 3D em aplicativos como Blender e Cinema 4D ou edita regularmente grandes arquivos de vídeo 6K e 8K? Então sim; a RTX 3090 é a melhor GPU profissional criativa do mercado para fluxos de trabalho acelerados por CUDA e RTX.
- Você tem renda disponível suficiente para uma plataforma de jogo absolutamente sem concessões? Também sim; o RTX 3090 é a melhor GPU para jogos que o dinheiro pode comprar, principalmente em jogos com rastreamento de raios e suporte a DLSS 2.0, uma lista que cresce a cada dia.
- Você trabalha principalmente em CAD, principalmente em áreas científicas com aplicativos como Creo e CATIA? Então não; o RTX 3090 não fornece as otimizações de driver necessárias que acompanham a linha de placas Quadro, e nenhuma quantidade de força bruta bruta pode superar isso. Estamos trabalhando para colocar as mãos no novo RTX-A6000, a substituição real do RTX 8000, para ajudar a informar pessoas como você.
- Você trabalha na área de aprendizado de máquina e IA? Este é um saco misto, porque parece um "sim", pois o desempenho no TensorFlow é excelente, mas infelizmente não há testes padronizados ou pontos de dados suficientes para fazer uma conclusão definitiva em relação a uma placa Quadro mais recente. Além disso, até o momento em que este artigo foi escrito, o TensorFlow não foi atualizado para suportar adequadamente os cartões Ampere. Nossa resposta atual é um suave sim. podemos olhar para MLCommonsName e MLperf no futuro como um acompanhamento, especificamente para casos de uso de IA e aprendizado de máquina.
- Atualmente, você possui um TITAN RTX e deseja atualizá-lo? Recomendamos que você aguarde um anúncio oficial da NVIDIA sobre o TITAN baseado em Ampere, que há rumores de que chegará eventualmente. Se seus casos de uso fizerem bom uso do TITAN, o RTX 3090 pode acabar em um downgrade, dependendo do seu fluxo de trabalho.
- Você faz muita virtualização de GPU? Este é um sólido não; o RTX 3090 não oferece suporte nativo a SR-IOV.
Com tudo isso considerado, esperamos que isso possa informar sua decisão de atualizar ou não, e se você for GeForce ou Quadro. Se o preço sugerido de $ 1,499 do RTX 3090 for muito rico para o seu sangue e você não precisar de mais de 10 GB de VRAM, o RTX 3080 também é uma ótima opção. Embora não tenha sido explicitamente testado aqui, descobrimos que nossos resultados foram geralmente 20% a 30% melhores do que o RTX 3080 com base em resultados em toda a Web, portanto, você pode esperar que ele supere (e tenha desempenho inferior) o Quadro RTX 8000 em aplicativos semelhantes. Também pode valer a pena esperar pelo rumor RTX 3080 Ti, sempre que isso acontecer, para um meio-termo. Por enquanto, vamos manter nossos olhos abertos para o TITAN baseado em Ampere para realmente preencher a lacuna entre uma placa de estação de trabalho completa e uma placa de jogo completa. Também estaremos de olho no pipeline de drivers da NVIDIA para ver se eles amenizam alguma das deficiências relacionadas ao trabalho da placa em versões futuras, mas temos nossas dúvidas. Gostaríamos muito de ouvir sua opinião sobre isso e também se houver algum benchmark ou caso de uso que tenhamos perdido e que você gostaria de ver, especialmente no que se refere a IA e aprendizado de máquina. Entre em contato conosco em nossos canais sociais e fique atento para mais análises criativas de profissionais e estações de trabalho.
Consulte Mais informação - Análise NVIDIA RTX A6000
NVIDIA Quadro RTX 8000 na Amazon
NVIDIA GeForce RTX 3090 Founder's Edition na Amazon
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS feed