Inicio Empreendimento Revisão do AMD Bergamo/Genoa-X

Revisão do AMD Bergamo/Genoa-X

by Jordan Ranous

Em junho, a AMD anunciou atualizações para seus Família AMD EPYC de 4ª Geração de processadores projetados para cargas de trabalho especializadas necessárias para atender aos requisitos das empresas. Os anúncios foram feitos durante a abertura do Data Center e AI Technology Premiere da AMD, com a apresentação dos processadores AMD EPYC 4X97 de 4ª geração, anteriormente codinome AMD Bergamo. Os processadores AMD EPYC 97X4 fornecem maior densidade de vCPU e maior desempenho visando aplicativos de IA e aplicativos executados na nuvem.

Em junho, a AMD anunciou atualizações para seus Família AMD EPYC de 4ª Geração de processadores projetados para cargas de trabalho especializadas necessárias para atender aos requisitos das empresas. Os anúncios foram feitos durante a abertura do Data Center e AI Technology Premiere da AMD, com a apresentação dos processadores AMD EPYC 4X97 de 4ª geração, anteriormente codinome AMD Bergamo. Os processadores AMD EPYC 97X4 fornecem maior densidade de vCPU e maior desempenho visando aplicativos de IA e aplicativos executados na nuvem.

Soquete de CPU AMD Bergamo

AMD Bérgamo

Os processadores AMD EPYC Zen 4, equipados com 3D V-Cache, codinome Genoa-X, foram identificados como a principal CPU de servidor x86 para computação técnica em um recente SPEC.org relatório. Esses processadores trazem 3D V-Cache para os chips Zen 96 de 4 núcleos e são ideais para cargas de trabalho de computação técnica exigentes.

CPU AMD Bergamo 9684X

De acordo com a AMD, alinhar seu roteiro de produtos aos ambientes dos clientes pode oferecer o desempenho necessário para cargas de trabalho de computação técnica, nativas da nuvem e de uso geral. A AMD assumiu a posição de que um tamanho não serve para todos. Esses novos processadores AMD EPYC foram projetados com base nesse conceito para oferecer maior desempenho para cargas de trabalho específicas.

CPU AMD Bergamo 9684X e 9754

Os aplicativos são cada vez mais projetados para cargas de trabalho nativas da nuvem, permitindo rápido desenvolvimento, implantação e atualizações. Os processadores AMD EPYC 97X4, com 128 núcleos, podem oferecer melhor taxa de transferência, desempenho até 3.7 vezes melhor para as principais cargas de trabalho nativas da nuvem em comparação com o Ampere.

Modelo Núcleos Tópicos Máximos TDP padrão (W) Frequência base (GHz) Aumentar Freq1 (GHz) Cache L3 (MB)
9754 128 256 360W 2.25 3.10 256
9754S 128 128 360W 2.25 3.10 256
9734 112 224 320W 2.20 3.00 256

Atendendo à necessidade de iterações de design mais rápidas e simulações abrangentes, os processadores AMD EPYC de 4ª geração com 3D V-Cache oferecem a melhor CPU x86 da categoria para cargas de trabalho de computação técnica, como dinâmica de fluidos computacional (CFD), análise de elementos finitos (FEA) , automação de projeto eletrônico (EDA) e análise estrutural. Esses processadores têm até 96 núcleos “Zen 4” e mais de 1 GB de cache L3 e podem acelerar significativamente o desenvolvimento de produtos.

Modelo Núcleos Tópicos Máximos TDP padrão (W) Frequência base (GHz) Aumentar Freq1 (GHz) Cache L3 (MB)
9684X 96 192 400W 2.55 3.70 1,152
9384X 32 64 320W 3.10 3.90 768
9184X 16 32 320W 3.55 4.20 768

Benchmarks AMD Bergamo e Genoa-X

Testamos duas novas CPUs e simulamos uma terceira desativando o SMT. No laboratório, tínhamos o 9754, um chip Bergamo de 128 núcleos e 256 threads, e o 9684X, um chip Genoa-X de 96 núcleos e 192 threads com enormes 1.1 GB de cache 3D L3 e um clock maior que o Genoa. Para simular o terceiro, desativamos o SMT em nosso 9754, pois a AMD também lançou o chip 9754S Bergamo, que vem sem multithreading e é apenas núcleos puros. Nosso teste do chip desativado para SMT será separado desta análise.

Conduzimos um extenso conjunto de benchmarks para avaliar o desempenho das CPUs AMD Bergamo e Genoa-X recém-lançadas. Começamos com os testes Cinebench R23 em configurações multi e single-core, que forneceram informações valiosas sobre os recursos de renderização desses processadores.

Parece que o próprio aplicativo, Cinebench R23, é limitado em como pode lidar com tantos encadeamentos. Observamos um limite de 128 núcleos, mas o 96 Core Genoa-X 3D Cache realmente brilha em seu desempenho, temas que serão comuns em todos os testes.

Em seguida, executamos o y-cruncher em níveis de 1 bilhão e 10 bilhões de dígitos para avaliar sua proeza computacional, especialmente para tarefas que envolvem um alto grau de processamento de números.

Mais baixo é melhor aqui, nossos resultados de Genoa de 2 processadores e 96 núcleos estão após alguns ajustes extensos e foram capazes de apresentar alguns bons números, e a configuração de estoque dos chips Genoa-X e Bergamo mostra algum potencial promissor para ajuste e ajustes para colocar alguns números recordes ainda mais impressionantes.

Em seguida, usamos os benchmarks do Blender, especificamente os testes Monster, Junkshop e Classroom, para medir o desempenho dessas CPUs em cenários de renderização graficamente intensivos.

No benchmark Blender, o poder bruto de 512 threads realmente apareceu, mais uma vez liderando as paradas com apenas uma configuração de estoque.

Por fim, executamos testes de CPU do Geekbench 6, conhecidos por seu amplo exame do desempenho do processador em operações single-core e multi-core. Este conjunto de testes nos forneceu uma visão abrangente dos recursos gerais, pontos fortes e melhorias incrementais dos processadores AMD Bergamo e Genoa-X.

Visão geral do desempenho

Aqui estão as pontuações brutas para cada um dos benchmarks. Lembre-se de que tivemos meses para fazer o ajuste e a configuração no sistema Genoa de 96 núcleos e executamos apenas uma configuração padrão do novo AMD Bergamo.

referência 2p/96c Gênova 1p/96c Génova-X 1p/128c Bérgamo 2p/128c Bérgamo
Cinebench R23 Multi 116744 93720 103876 102125
Cinebench R23 Single 1294 1301 1098 1089
Proporção Cinebench MP 90.22 72.04 94.65 93.75
triturador de y 1b 8.882 10.296 9.568 9.184
triturador de y 10b 51.071 72.377 80.171 55.683
Monstro do Liquidificador 1700.647985 879.580323 1031.49474 2038.714424
Junkshop Blender 1101.839271 605.445705 704.167826 1382.575225
Sala de aula do liquidificador 869.476693 421.318478 506.665693 1045.959162
Geekbench 6 CPU Simples 2048 2093 1738 1723
Geekbench 6 CPU Multi 20217 21329 18683 17916

AMD Bergamo para IA

Apresentando uma variedade de mecanismos de inferência de IA de fornecedores de primeira linha, o Benchmark UL Procyon AI Inference atende a um amplo espectro de configurações e requisitos de hardware. A pontuação de referência fornece um resumo conveniente e padronizado do desempenho de inferência no dispositivo. Isso nos permite comparar e contrastar diferentes configurações de hardware em situações do mundo real sem a necessidade de soluções internas.

Subcontratante Modelo Tempo Médio de Inferência Tempo de Inferência Mediano Contagem total de inferências
2p/96c Gênova MobileNet V3 3.61 ms 3.63 ms 45,800
1p/96c Génova-X MobileNet V3 2.71 ms 2.72 ms 58,631
1p/128c Bérgamo MobileNet V3 3.90 ms 3.91 ms 41,538
2p/128c Bérgamo MobileNet V3 4.10 ms 4.16 ms 40,008
2p/96c Gênova ResNet 50 6.36 ms 6.34 ms 26,525
1p/96c Génova-X ResNet 50 6.66 ms 6.64 ms 25,049
1p/128c Bérgamo ResNet 50 10.14 ms 10.08 ms 16,919
2p/128c Bérgamo ResNet 50 8.21 ms 8.22 ms 20,842
2p/96c Gênova Inception V4 25.98 ms 25.99 ms 6,555
1p/96c Génova-X Inception V4 29.19 ms 29.18 ms 5,879
1p/128c Bérgamo Inception V4 33.17 ms 33.04 ms 5,158
2p/128c Bérgamo Inception V4 30.63 ms 30.68 ms 5,573
2p/96c Gênova DeepLab V3 25.51 ms 25.33 ms 5,660
1p/96c Génova-X DeepLab V3 28.26 ms 27.86 ms 5,394
1p/128c Bérgamo DeepLab V3 32.16 ms 32.09 ms 4,708
2p/128c Bérgamo DeepLab V3 31.16 ms 30.57 ms 4,807
2p/96c Gênova YOLO V3 34.10 ms 34.13 ms 4,818
1p/96c Génova-X YOLO V3 43.59 ms 43.58 ms 3,831
1p/128c Bérgamo YOLO V3 44.50 ms 44.39 ms 3,739
2p/128c Bérgamo YOLO V3 41.35 ms 41.38 ms 4,001
2p/96c Gênova Real-ESRGAN 2540.04 ms 2524.03 ms 71
1p/96c Génova-X Real-ESRGAN 3725.07 ms 3720.35 ms 49
1p/128c Bérgamo Real-ESRGAN 2734.77 ms 2717.41 ms 66
2p/128c Bérgamo Real-ESRGAN 2291.66 ms 2301.35 ms 79

Considerações Finais

Nossos testes com o novo CPU AMD Bergamo de 128 núcleos refletem os ganhos esperados do aumento na contagem de núcleos. Com relação ao desempenho bruto, a nova CPU lidava com dados e tarefas de computação intensiva com uma facilidade que parecia quase sem esforço. Nossos testes com renderização 3D e aplicativos de computação, em particular, mostraram a verdadeira proeza desses núcleos extras.

Servidor de CPU AMD Epyc Bergamo

Observamos um aumento significativo nas velocidades de processamento em relação ao Genoa de 96 núcleos, com e sem SMT habilitado, destacando a eficiência do design de chiplet da AMD. À medida que nos aprofundamos na era da computação avançada com contagem ultra-alta de núcleos, esse monstro de 128 núcleos e 256 threads define um novo padrão em densidade de rack.

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed