Início Empreendimento Revisão AMD EPYC de 4ª Geração (AMD Genoa)

Revisão AMD EPYC de 4ª Geração (AMD Genoa)

by Jordan Ranous

A AMD anunciou a disponibilidade geral dos novos processadores EPYC 9004 de 4ª geração. Com o nome de código AMD Genoa, a nova linha de CPUs suporta 12 canais de DDR5-4800 (capacidade de memória de até 6 TB por soquete), 128 faixas de PCIe Gen5, tecnologia AMD Infinity Fabric/Guard e até 96 núcleos. Isso os torna ideais para cargas de trabalho críticas em computação em nuvem, empresarial e de alto desempenho.

A AMD anunciou a disponibilidade geral dos novos processadores EPYC 9004 de 4ª geração. Com o nome de código AMD Genoa, a nova linha de CPUs suporta 12 canais de DDR5-4800 (capacidade de memória de até 6 TB por soquete), 128 faixas de PCIe Gen5, tecnologia AMD Infinity Fabric/Guard e até 96 núcleos. Isso os torna ideais para cargas de trabalho críticas em computação em nuvem, empresarial e de alto desempenho.

Benefícios das CPUs EPYC 9004 de 4ª geração para empresas

Com sua enorme contagem de 96 núcleos em um único processador, os novos processadores AMD Genoa permitirão que as organizações reduzam seu espaço físico implantando menos servidores e aproveitando servidores mais poderosos. Isso traz maior flexibilidade para os ecossistemas de data center e os ajuda a atingir metas de sustentabilidade e proteção para o futuro.

Servidor AMD Genoa

A AMD construiu seus novos processadores EPYC com um grande foco na segurança aprimorada, particularmente com a expansão do AMD Infinity Guard, o conjunto de recursos da empresa que oferece camadas físicas e virtuais de proteção para suas CPUs. Por exemplo, ele apresenta o dobro do número de chaves de criptografia em comparação com as gerações anteriores, o que ajuda os clientes a manter seus dados seguros, sejam eles armazenados localmente, na nuvem ou residindo no armazenamento.

As organizações poderão se beneficiar de seu conjunto de recursos "all-in", com opções para escolher um modelo com contagem e frequência de núcleos (consulte a tabela abaixo) que melhor atenda às suas necessidades. Além disso, os processadores AMD EPYC de 4ª geração agora suportam memória DDR5 e PCIe Gen 5, ambos vitais para aplicativos de IA e ML. É claro que os fornecedores de SSD corporativos estão se esforçando para colocar suas unidades no mainstream, desbloqueando o dobro do potencial de largura de banda da geração 4.

SKUs da série AMD Genoa 9004

Modelo Núcleos TDP padrão CTDP Base (GHz) Aumento (GHz)
9654 96 360w 320-400w 2.4 3.7
9634 84 290w 240-300w 2.25 3.7
9554 64 360w 320-400w 3.1 3.75
9534 64 280w 240-300w 2.45 3.7
9454 48 290w 240-300w 2.75 3.8
9354 32 280w 240-300w 3.25 3.8
9334 32 210w 200-240w 2.7 3.9
9254 24 200w 200-240w 2.9 4.15
9224 24 200w 200-240w 2.5 3.7
9124 16 200w 200-240w 3.0 3.7
9474F 48 360w 320-400w 3.6 4.1
9374F 32 320w 320-400w 3.85 4.3
9274F 24 320w 320-400w 4.05 4.3
9174F 16 320w 320-400w 4.1 4.4
9654P 96 360w 320-400w 2.4 3.7
9554P 64 360w 320-400w 3.1 3.75
9454P 48 290w 240-300w 2.75 3.8
9354P 32 280w 240-300w 3.25 3.8

AMD Genoa – Arquitetura Zen 4

Lançado em setembro passado, o Zen 4 é a nova microarquitetura para as CPUs AMD EPYC 9004, apresentando o núcleo de maior desempenho da AMD até o momento. Isso ajuda as CPUs EPYC 9004 a oferecer novos níveis de liderança em desempenho e eficiência energética e permite que os clientes acelerem a modernização do data center para maior rendimento de aplicativos e insights mais acionáveis. O Zen 4 também alimenta seus novos processadores de desktop Ryzen 7000 para consumidores.

amd genoa DRAM

Uma das maiores mudanças que o Zen 4 traz é que ele não suporta mais a memória DDR4, pois mudou apenas para DDR5. Além disso, o Zen 4 oferece suporte aos novos perfis AMD EXPO SPD, permitindo um ajuste de memória e overclocking mais abrangentes pelos fabricantes de RAM.

Alguns dos outros novos recursos incluem:

  • Cache privado rápido de 1M L2
  • Mais falhas pendentes suportadas de L2 a L3 por núcleo
  • Mais falhas pendentes suportadas de L3 para memória
  • L3 e L2 aprimorados falham BW
  • Maior BW permite melhorias na pré-busca

Visão geral da microarquitetura do Zen 4

Zen 4 x Zen 3

Melhorias da série AMD EPYC 9004 em relação às gerações anteriores

O novo AMD Genoa oferece uma série de melhorias perceptíveis, incluindo um aumento na contagem máxima de núcleos para impressionantes 96 por CPU. Isso é significativo em comparação com as últimas gerações:

  • Máximo Núcleos 64 por CPU com o 7773X e 7763 (3rd Geração EPYC) modelos
  • Máximo Núcleos 40 por CPU com o 8380 (3rd Gen Xeon Platinum) modelo

A AMD indica que isso se traduzirá em aproximadamente 2.3x o desempenho em comparação com a concorrência (ou 1.6x para desempenho por watt) quando se trata de soluções mais rápidas. Este será o maior aumento no desempenho geral que vimos em seus lançamentos de próxima geração. Para operações de negócios empresariais por segundo, o 4th Gen AMD espera que suas CPUs EPYC ofereçam aproximadamente 2.6 vezes o desempenho, sugerindo um aumento de desempenho de 2.4 vezes nas velocidades de renderização ao usar o Arnold Autodesk.

amd genoa heatsync

Ele também oferece uma atualização significativa no desempenho do núcleo devido à arquitetura Zen 4 e um aumento potencial de aproximadamente 14% na elevação do IPC para CPUs de servidor.

A nova série EPYC 9004 também possui recursos de plataforma de liderança que são provisionados para dimensionamento:

  • DDR12-5 de 4800 canais com desempenho aprimorado de classificação única
  • 128L 32Gps e 8L 8Gps SERDES multifuncionais (serializador/desserializador)

Além disso, possui suporte de memória CXL1.1+ (CXL “Type3”), que inclui recursos avançados de anexação de memória para DDR e memória emergente, bem como SEV-SNP, QoS e extensões de gerenciamento de memória em camadas. Para maior segurança, ele suporta extensões de chave SEV-SNP e AES-256-XTS.

Memória AMD EPYC série 9004

As CPUs AMD Genoa suportam 12 canais por CPU, capacidade de 6 TB por soquete, até DDR4800, e teoricamente também podem atingir até 460 GB/s na largura de banda máxima.

Aqui está uma visão geral das comparações entre o desempenho da largura de banda de memória de 3ª e 4ª geração:

Posicionamento da CPU AMD EPYC Série 9004

Como na geração anterior, a AMD categorizou suas novas CPUs em três grupos diferentes:

  • Desempenho principal, que é composto por CPUs de alta frequência com uma grande proporção de cache/núcleo. Os modelos que se enquadram nisso incluem 9474F (48 núcleos a 360 W), 9374F (32 núcleos a 320 W), 9274F (24 núcleos a 320 W) e 9174F (16 núcleos a 320 W).
  • Densidade de núcleo, que é composto pelas CPUs de maior número de núcleos e threads. Os modelos que se enquadram nisso incluem 9654/P (96 núcleos a 360 W), 9634 (84 núcleos a 290 W), 9554/P (64 núcleos a 360 W), 9534 (64 núcleos a 280 W) e 9454/P (48 núcleos a 290 W). ).
  • Desempenho equilibrado e otimizado, que é composto por CPUs que apresentam um equilíbrio entre desempenho e TCO. Os modelos que se enquadram nisso incluem 9354/P (32 núcleos a 280 W), 9334 (32 núcleos a 210 W), 9254 (24 núcleos a 200 W), 9224 (24 núcleos a 200 W) e 9124 (16 núcleos a 200 W).

Desempenho da CPU AMD Genoa 9004

Configuração de Benchmarking

Para nosso teste inicial, posicionamos as atuais plataformas Intel e AMD de ponta uma contra a outra em um lote inicial de cargas de trabalho com uso intensivo de CPU. Para nossa plataforma Intel, aproveitamos nossa plataforma Intel 8380 de CPU dupla inicial construída em torno de um servidor OEM Intel contra nossa plataforma AMD EPYC 9654 de CPU dupla dentro de um chassi Quanta.

Especificações da plataforma Intel:
2 x CPUs Intel Xeon Platinum 8380 de 40 núcleos
16 x 32 GB 3200 MHz DDR4
SO Windows Server 2022

Especificações da plataforma AMD:
2 x CPUs AMD EPYC 9654 de 96 núcleos
24 x 64 GB 4800 MHz DDR5
SO Windows Server 2022

V-Ray

V-Ray Benchmark é um aplicativo do Chaos Group para pontuar e comparar várias CPUs e GPUs. O Chaos Group é conhecido por seu trabalho em visualizações e renderização especializado em tecnologia de rastreamento de raios. O V-Ray Benchmark contém uma cena de teste de construção personalizada para testar qualquer combinação de CPU e GPU e comparar o desempenho de um sistema com outro.

Em nosso laboratório, utilizamos o benchmark V-Ray no modo somente CPU. Para minimizar possíveis gargalos, utilizamos um SSD Solidigm P5520 7.68 TB NVMe e uma instalação limpa do Windows Server 2022. O topo da tabela de classificação para V-Ray era anteriormente um sistema de processador 2x AMD EPYC 7K83 64-Core que obteve um impressionante média de 100,844 em 6 testes. Nosso sistema de amostra com 2x AMD EPYC Genoa 96-Core obteve uma média de 126,940 em 9 testes. Comparado com o sistema Intel

Compilação do Firefox a partir da fonte

Firefox, o navegador da Mozilla, é um enorme projeto de código aberto. A Mozilla deseja oferecer a você a capacidade de compilar o projeto a partir do código-fonte, algo que se tornou mais onipresente como uma ferramenta para comparar o desempenho. O download para isso está em vários gigabytes com milhares de arquivos que precisam ser compilados.

Em nossos testes, ficamos mais do que impressionados com o tempo de 6 minutos e 57 segundos do equipamento Intel Xeon 8380, isso foi até dispararmos no equipamento Genoa, que chegou a um tempo insanamente rápido de 6 minutos e 33 minutos. segundo tempo de compilação. Para comparação, uma estação de trabalho de primeira linha será capaz de concluir esta tarefa em pouco menos de 10 minutos se você alimentá-la com uma dieta constante de nitrogênio líquido e excesso de voltagem, o que significa que estamos lidando com uma potência bruta séria fora do portão com essas fichas.

FF Compilado a partir da fonte
2 x AMD 9654 96 núcleos 6:33.85
2 x Intel 8380 40 núcleos 6:57.85

Blender – referência CLI

O Blender Benchmark é um padrão estabelecido na cena de benchmarking de CPU e GPU. O Blender é uma ferramenta de modelagem e animação 3D de código aberto altamente avançada e considerada líder na área. Consistente com o tema dos processadores Genoa EPYC, estamos utilizando-o para mostrar a flexibilidade de ter uma arquitetura combinada que é capaz de uma CPU e um possível substituto de GPU para implantações de rack de alta densidade.

O Blender possui três benchmarks, conhecidos como Monster, Junkshop e Classroom. São três cenas renderizadas sequencialmente e recebem uma pontuação para cada seção, que é então somada para uma pontuação total.

Teste do liquidificador 2 x AMD 9654 96 núcleos 2 x Intel 8380 40 núcleos
Monstro 1788.189128 671.145395
sucata 1062.533142 407.141514
Sala de aula 850.646333 320.507039
Total 3701.368603 1398.793948

A plataforma Genoa obteve um total esmagador de 3701 pontos, com 1788.2 no Monster, 1062.5 no Junkshop e 850.6 no benchmark Classroom. Comparar o Genoa com o Intel Xeon Platinum pode parecer injusto em alguns aspectos, considerando que a Intel vem apenas com cerca de 41% da contagem de núcleos, no entanto, se olharmos para os dados e normalizarmos a diferença na contagem de núcleos, os resultados ficam interessantes . O chip AMD Genoa, graças à sua arquitetura mais recente, conjuntos de instruções e uso de DDR5, é cerca de 10% mais rápido que o equipamento da Intel.

2 x AMD 9654 96 núcleos Porcentagem de contagem relativa de núcleos Intel 2 x Intel 8380 40 núcleos
Núcleo 192 41.67% Núcleo 80
384 Tópico 41.67% 160 Tópico

 

2 x AMD 9654 96 núcleos 2 x Intel 8380 40 núcleos
Pontuação total do liquidificador 3701 1399
Cores / Fios 192/384 80/160
Contagem Intel Core/AMD 41.67%
Comparação direta de pontuação Intel/AMD 37.79%
Pontuação AMD Normalizada Núcleo 1542
Relativo Intel/AMD, Núcleo Normalizado 90.70%

Cinebench R23

O Cinebench da Maxon tem sido um dos pilares do benchmarking há algum tempo, graças à sua metodologia de teste padronizada e ao uso de testes do mundo real para avaliar o desempenho multicore e single-core. O R23, a última iteração do Cinebench, tem uma limitação que não tivemos que contornar anteriormente; Ele só é capaz de fazer benchmarking de 256 núcleos/threads. Nosso equipamento de teste tem 384. Curiosamente, havia muitos benchmarks "padrão" e aplicativos que encontramos com limite de núcleo em 256, então o Cinebench não está sozinho em precisar de uma atualização para o futuro de contagem ultra-core que estamos seguindo. em direção a.

Para tentar solucionar essa limitação, executamos dois testes simultaneamente e limitamos cada instância a 196 threads para tentar dividir a carga uniformemente. Normalmente, você pode definir a afinidade da CPU no Gerenciador de Tarefas, no entanto, algo estava bloqueando essa operação com o Cinebench, suspeitamos que seja um sinalizador que foi definido na maneira subjacente como a API está sendo chamada para prioridade da CPU. Tentamos executá-lo como usuários menos privilegiados e iniciá-lo com o sinalizador de linha de comando “start /affinity NODE 0” para tentar forçá-lo, mas não conseguimos bloquear o aplicativo em um único nó NUMA.

Incapaz de atribuir uma afinidade específica para o programa, apenas executamos o aplicativo duas vezes e os iniciamos juntos. Os resultados mostraram duas pontuações drasticamente diferentes das duas instâncias do aplicativo, no entanto, monitorando o uso da CPU, pudemos observá-lo oscilando entre 80 e 100 por cento de utilização durante o teste.

Instância Única do Cinebench 2 x AMD 9654 96 núcleos 2 x Intel 8380 40 núcleos
Múltiplos Fios (cap 256) 85,160 70,540
Single Core 972 985
Taxa de MP 87.65x 71.63x

 

2 Instâncias Cinebench
Execução de teste AMD 1 Execução de teste AMD 2
Pontuação, 1ª instância 82,063 68,231
Pontuação, 2ª instância 57,557 57,221
Total 139,620 125,452

Considerações Finais

O processo de benchmarking das CPUs AMD EPYC 9004 foi um exercício interessante, para dizer o mínimo. Os desafios que enfrentamos no processo de revisão inicial são indicativos dos desafios gerais que os desenvolvedores de software terão de enfrentar à medida que o cenário da CPU muda para o modelo de densidade ultra-alta. Embora existam alguns aplicativos disponíveis no mercado que podem utilizá-lo, cada vez mais encontramos limites de software que não conseguiram ultrapassar alguns limites de contagem de threads.

No laboratório, estamos trabalhando em alguns benchmarks de Tensorflow Machine Learning desenvolvidos internamente para poder testar essas novas CPUs em cenários do mundo real. Acompanharemos os resultados quando tivermos confiança nos resultados do novo aplicativo e o tivermos validado em várias plataformas e gerações de CPUs.

Por enquanto, porém, o lançamento do AMD Genoa é muito empolgante, como vimos até agora com o servidor Quanta. Mais, HPE e Dell anunciaram seus servidores, cada um oferecendo quatro sistemas, dois chassis de 1 CPU e dois chassis de 2 CPUs. Isso trará o AMD Genoa para a empresa imediatamente, expandindo rapidamente a presença do Genoa além dos hyperscalers.

amd genoa CPU nua

A grande questão então é óbvia: AMD Genoa vale o investimento? Isso se reduzirá à carga de trabalho em termos de justificar o gasto, mas, assim como DPUs para VMware, essas novas tecnologias de CPU têm muito a oferecer em termos de poder de computação, segurança e eficiência. Substituir o EPYC de 3ª geração por esses provavelmente é um pouco prematuro, mas qualquer um que esteja esperando um motivo para pular deve ficar muito feliz em ver o que Genoa trouxe para a mesa.

Temos muito mais testes e trabalho a fazer e com o Intel Sapphire Rapids chegando em breve, queremos comparar o melhor que cada um tem a oferecer. Mas, por enquanto, o AMD Genoa é extremamente atraente e deve estar em qualquer PoC de atualização de infraestrutura para que as organizações possam entender melhor o impacto de todos esses núcleos e eficiências que a AMD tem a oferecer.

Vídeo de lançamento da AMD

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed