Em junho, a AMD anunciou atualizações para seus Família AMD EPYC de 4ª Geração de processadores projetados para cargas de trabalho especializadas necessárias para atender aos requisitos das empresas. Os anúncios foram feitos durante a abertura do Data Center e AI Technology Premiere da AMD, com a apresentação dos processadores AMD EPYC 4X97 de 4ª geração, anteriormente codinome AMD Bergamo. Os processadores AMD EPYC 97X4 fornecem maior densidade de vCPU e maior desempenho visando aplicativos de IA e aplicativos executados na nuvem.
Em junho, a AMD anunciou atualizações para seus Família AMD EPYC de 4ª Geração de processadores projetados para cargas de trabalho especializadas necessárias para atender aos requisitos das empresas. Os anúncios foram feitos durante a abertura do Data Center e AI Technology Premiere da AMD, com a apresentação dos processadores AMD EPYC 4X97 de 4ª geração, anteriormente codinome AMD Bergamo. Os processadores AMD EPYC 97X4 fornecem maior densidade de vCPU e maior desempenho visando aplicativos de IA e aplicativos executados na nuvem.
AMD Bérgamo
Os processadores AMD EPYC Zen 4, equipados com 3D V-Cache, codinome Genoa-X, foram identificados como a principal CPU de servidor x86 para computação técnica em um recente SPEC.org relatório. Esses processadores trazem 3D V-Cache para os chips Zen 96 de 4 núcleos e são ideais para cargas de trabalho de computação técnica exigentes.
De acordo com a AMD, alinhar seu roteiro de produtos aos ambientes dos clientes pode oferecer o desempenho necessário para cargas de trabalho de computação técnica, nativas da nuvem e de uso geral. A AMD assumiu a posição de que um tamanho não serve para todos. Esses novos processadores AMD EPYC foram projetados com base nesse conceito para oferecer maior desempenho para cargas de trabalho específicas.
Os aplicativos são cada vez mais projetados para cargas de trabalho nativas da nuvem, permitindo rápido desenvolvimento, implantação e atualizações. Os processadores AMD EPYC 97X4, com 128 núcleos, podem oferecer melhor taxa de transferência, desempenho até 3.7 vezes melhor para as principais cargas de trabalho nativas da nuvem em comparação com o Ampere.
Modelo | Núcleos | Tópicos Máximos | TDP padrão (W) | Frequência base (GHz) | Aumentar Freq1 (GHz) | Cache L3 (MB) |
9754 | 128 | 256 | 360W | 2.25 | 3.10 | 256 |
9754S | 128 | 128 | 360W | 2.25 | 3.10 | 256 |
9734 | 112 | 224 | 320W | 2.20 | 3.00 | 256 |
Atendendo à necessidade de iterações de design mais rápidas e simulações abrangentes, os processadores AMD EPYC de 4ª geração com 3D V-Cache oferecem a melhor CPU x86 da categoria para cargas de trabalho de computação técnica, como dinâmica de fluidos computacional (CFD), análise de elementos finitos (FEA) , automação de projeto eletrônico (EDA) e análise estrutural. Esses processadores têm até 96 núcleos “Zen 4” e mais de 1 GB de cache L3 e podem acelerar significativamente o desenvolvimento de produtos.
Modelo | Núcleos | Tópicos Máximos | TDP padrão (W) | Frequência base (GHz) | Aumentar Freq1 (GHz) | Cache L3 (MB) |
9684X | 96 | 192 | 400W | 2.55 | 3.70 | 1,152 |
9384X | 32 | 64 | 320W | 3.10 | 3.90 | 768 |
9184X | 16 | 32 | 320W | 3.55 | 4.20 | 768 |
Benchmarks AMD Bergamo e Genoa-X
Testamos duas novas CPUs e simulamos uma terceira desativando o SMT. No laboratório, tínhamos o 9754, um chip Bergamo de 128 núcleos e 256 threads, e o 9684X, um chip Genoa-X de 96 núcleos e 192 threads com enormes 1.1 GB de cache 3D L3 e um clock maior que o Genoa. Para simular o terceiro, desativamos o SMT em nosso 9754, pois a AMD também lançou o chip 9754S Bergamo, que vem sem multithreading e é apenas núcleos puros. Nosso teste do chip desativado para SMT será separado desta análise.
Conduzimos um extenso conjunto de benchmarks para avaliar o desempenho das CPUs AMD Bergamo e Genoa-X recém-lançadas. Começamos com os testes Cinebench R23 em configurações multi e single-core, que forneceram informações valiosas sobre os recursos de renderização desses processadores.
Parece que o próprio aplicativo, Cinebench R23, é limitado em como pode lidar com tantos encadeamentos. Observamos um limite de 128 núcleos, mas o 96 Core Genoa-X 3D Cache realmente brilha em seu desempenho, temas que serão comuns em todos os testes.
Em seguida, executamos o y-cruncher em níveis de 1 bilhão e 10 bilhões de dígitos para avaliar sua proeza computacional, especialmente para tarefas que envolvem um alto grau de processamento de números.
Mais baixo é melhor aqui, nossos resultados de Genoa de 2 processadores e 96 núcleos estão após alguns ajustes extensos e foram capazes de apresentar alguns bons números, e a configuração de estoque dos chips Genoa-X e Bergamo mostra algum potencial promissor para ajuste e ajustes para colocar alguns números recordes ainda mais impressionantes.
Em seguida, usamos os benchmarks do Blender, especificamente os testes Monster, Junkshop e Classroom, para medir o desempenho dessas CPUs em cenários de renderização graficamente intensivos.
No benchmark Blender, o poder bruto de 512 threads realmente apareceu, mais uma vez liderando as paradas com apenas uma configuração de estoque.
Por fim, executamos testes de CPU do Geekbench 6, conhecidos por seu amplo exame do desempenho do processador em operações single-core e multi-core. Este conjunto de testes nos forneceu uma visão abrangente dos recursos gerais, pontos fortes e melhorias incrementais dos processadores AMD Bergamo e Genoa-X.
Visão geral do desempenho
Aqui estão as pontuações brutas para cada um dos benchmarks. Lembre-se de que tivemos meses para fazer o ajuste e a configuração no sistema Genoa de 96 núcleos e executamos apenas uma configuração padrão do novo AMD Bergamo.
referência | 2p/96c Gênova | 1p/96c Génova-X | 1p/128c Bérgamo | 2p/128c Bérgamo | |
---|---|---|---|---|---|
Cinebench R23 Multi | 116744 | 93720 | 103876 | 102125 | |
Cinebench R23 Single | 1294 | 1301 | 1098 | 1089 | |
Proporção Cinebench MP | 90.22 | 72.04 | 94.65 | 93.75 | |
triturador de y 1b | 8.882 | 10.296 | 9.568 | 9.184 | |
triturador de y 10b | 51.071 | 72.377 | 80.171 | 55.683 | |
Monstro do Liquidificador | 1700.647985 | 879.580323 | 1031.49474 | 2038.714424 | |
Junkshop Blender | 1101.839271 | 605.445705 | 704.167826 | 1382.575225 | |
Sala de aula do liquidificador | 869.476693 | 421.318478 | 506.665693 | 1045.959162 | |
Geekbench 6 CPU Simples | 2048 | 2093 | 1738 | 1723 | |
Geekbench 6 CPU Multi | 20217 | 21329 | 18683 | 17916 |
AMD Bergamo para IA
Apresentando uma variedade de mecanismos de inferência de IA de fornecedores de primeira linha, o Benchmark UL Procyon AI Inference atende a um amplo espectro de configurações e requisitos de hardware. A pontuação de referência fornece um resumo conveniente e padronizado do desempenho de inferência no dispositivo. Isso nos permite comparar e contrastar diferentes configurações de hardware em situações do mundo real sem a necessidade de soluções internas.
Subcontratante | Modelo | Tempo Médio de Inferência | Tempo de Inferência Mediano | Contagem total de inferências |
---|---|---|---|---|
2p/96c Gênova | MobileNet V3 | 3.61 ms | 3.63 ms | 45,800 |
1p/96c Génova-X | MobileNet V3 | 2.71 ms | 2.72 ms | 58,631 |
1p/128c Bérgamo | MobileNet V3 | 3.90 ms | 3.91 ms | 41,538 |
2p/128c Bérgamo | MobileNet V3 | 4.10 ms | 4.16 ms | 40,008 |
2p/96c Gênova | ResNet 50 | 6.36 ms | 6.34 ms | 26,525 |
1p/96c Génova-X | ResNet 50 | 6.66 ms | 6.64 ms | 25,049 |
1p/128c Bérgamo | ResNet 50 | 10.14 ms | 10.08 ms | 16,919 |
2p/128c Bérgamo | ResNet 50 | 8.21 ms | 8.22 ms | 20,842 |
2p/96c Gênova | Inception V4 | 25.98 ms | 25.99 ms | 6,555 |
1p/96c Génova-X | Inception V4 | 29.19 ms | 29.18 ms | 5,879 |
1p/128c Bérgamo | Inception V4 | 33.17 ms | 33.04 ms | 5,158 |
2p/128c Bérgamo | Inception V4 | 30.63 ms | 30.68 ms | 5,573 |
2p/96c Gênova | DeepLab V3 | 25.51 ms | 25.33 ms | 5,660 |
1p/96c Génova-X | DeepLab V3 | 28.26 ms | 27.86 ms | 5,394 |
1p/128c Bérgamo | DeepLab V3 | 32.16 ms | 32.09 ms | 4,708 |
2p/128c Bérgamo | DeepLab V3 | 31.16 ms | 30.57 ms | 4,807 |
2p/96c Gênova | YOLO V3 | 34.10 ms | 34.13 ms | 4,818 |
1p/96c Génova-X | YOLO V3 | 43.59 ms | 43.58 ms | 3,831 |
1p/128c Bérgamo | YOLO V3 | 44.50 ms | 44.39 ms | 3,739 |
2p/128c Bérgamo | YOLO V3 | 41.35 ms | 41.38 ms | 4,001 |
2p/96c Gênova | Real-ESRGAN | 2540.04 ms | 2524.03 ms | 71 |
1p/96c Génova-X | Real-ESRGAN | 3725.07 ms | 3720.35 ms | 49 |
1p/128c Bérgamo | Real-ESRGAN | 2734.77 ms | 2717.41 ms | 66 |
2p/128c Bérgamo | Real-ESRGAN | 2291.66 ms | 2301.35 ms | 79 |
Considerações Finais
Nossos testes com o novo CPU AMD Bergamo de 128 núcleos refletem os ganhos esperados do aumento na contagem de núcleos. Com relação ao desempenho bruto, a nova CPU lidava com dados e tarefas de computação intensiva com uma facilidade que parecia quase sem esforço. Nossos testes com renderização 3D e aplicativos de computação, em particular, mostraram a verdadeira proeza desses núcleos extras.
Observamos um aumento significativo nas velocidades de processamento em relação ao Genoa de 96 núcleos, com e sem SMT habilitado, destacando a eficiência do design de chiplet da AMD. À medida que nos aprofundamos na era da computação avançada com contagem ultra-alta de núcleos, esse monstro de 128 núcleos e 256 threads define um novo padrão em densidade de rack.
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed