Início Empreendimento Análise do AMD EPYC 9754S – Uma CPU com um conjunto muito particular de habilidades

Análise do AMD EPYC 9754S – Uma CPU com um conjunto muito particular de habilidades

by Jordan Ranous

O AMD EPYC 9754S foi projetado para cargas de trabalho de HPC com SMT desabilitado, oferecendo 128 núcleos e 128 threads com um TDP padrão de 360W.

No ano passado, a AMD expandiu sua linha de CPUs para servidores com EPYC de 4ª geração. Embora o EPYC 128 de 256 núcleos e 9754 threads tenha sido o mais vendido, logo abaixo dele na matriz SKU está o AMD EPYC 9754S. A diferença entre os dois chips é simples, mas dramática. O 9754S tem o Multithreading Simultâneo (SMT) desabilitado. Isso significa que o 9754S oferece os mesmos 128 núcleos que o 9754, mas com o SMT desabilitado, apenas 128 threads, em comparação com 256. Essa mudança traz um bom desconto para clientes que já desabilitam o SMT.

AMD EPYC9754S

Modelo Núcleos Tópicos Máximos TDP padrão Freq. base (GHz) Aumente a Freq. (GHz) Cache L3 (MB)
9754 128 256 360W 2.25 3.10 256
9754S 128 128 360W 2.25 3.10 256
9734 112 224 320W 2.2 3.0 256

O que é AMD SMT e por que existe o 9754S?

Com o SMT, um único núcleo de CPU EPYC pode processar dois threads simultaneamente, o que pode levar a um uso mais eficiente dos recursos do processador. Quando um thread está aguardando o carregamento de dados da memória ou está ocioso, o outro thread pode estar executando instruções. Isso significa que o núcleo passa menos tempo ocioso, melhorando potencialmente o desempenho. Isto é especialmente verdadeiro em casos de uso como virtualização e renderização.

Desativar o SMT pode permitir que os fabricantes comercializem esses chips como produtos de nível inferior, garantindo que ainda atendam a critérios específicos de desempenho e estabilidade. CPUs com SMT desativado podem ser influenciadas por processos de categorização, estratégias de segmentação de mercado e pelo desejo de atender a necessidades específicas de desempenho ou eficiência, mostrando a abordagem diferenciada que os fabricantes adotam no planejamento e posicionamento de produtos.

Dito isso, nem todas as cargas de trabalho se beneficiam do SMT e, muitas vezes, um servidor AMD pode ter o SMT desabilitado no BIOS. Embora isso possa ser um ajuste eficaz, traz à tona outro ponto importante. O chip 9754S com SMT desativado é um pouco mais barato que o 9754. Em qualquer caso, aplicativos de thread único, cargas de trabalho computacionais e quaisquer casos de uso em que a latência da CPU seja extremamente importante podem se beneficiar com a desativação do SMT.

Desempenho AMD EPYC 9754S vs EPYC 9754

Queremos realizar dois de nossos testes regulares, y-cruncher e Cinebench 2024, e ver quais diferenças de desempenho obtemos com e sem SMT. Executamos o 9754S e o 9754 um contra o outro enquanto executamos o 9754 com o SMT ativado e desativado para ver quais vantagens o 9754S tem sem o SMT.

Plataforma de teste e especificações:

Cinebench 2024

O primeiro é o Cinebench 2024, com SMT habilitado em nosso modelo não S. Aqui podemos ver que estamos dentro das diferenças de variação entre corridas.

Processador Cinebench 2024 2x EPYC9754S 2x EPYC9754
 CPU multinúcleo 2,682 2,587
 CPU de núcleo único 68 69
Taxa de MP 39.19x 37.64x

O y-cruncher foi selecionado especificamente por causa da arquitetura do programa, posicionado como um teste total do sistema. Realizando um cálculo de Pi tão grande que cabe na memória do sistema, nosso objetivo é provar nossa intuição de longa data, de que o SMT pode impactar negativamente as cargas de trabalho vinculadas à CPU e à memória. Vamos dar uma olhada nos resultados antes de mergulhar no que tudo isso significa.

triturador de y 0.8.3

y-cruncher 0.8.3 Tempo total de cálculo em segundos
(menor é melhor)
2x EPYC9754S 2x EPYC 9754 (SMT desligado) 2x EPYC 9754 (SMT ligado) 9754 SMT desligado aumento de desempenho
1 bilhões 13.481 13.546 14.139 4.65%
2.5 bilhões 23.818 24.144 28.111 15.27%
5 bilhões 40.760 40.797 49.271 17.27%
10 bilhões 77.409 77.959 95.420 18.88%
25 bilhões 203.303 202.124 233.629 12.98%
50 bilhões 475.557 476.949 520.349 8.61%
100 bilhões 1,248.458 1,251.36 1,242.419 -0.49%

triturador de y 0.8.4

y-cruncher 0.8.4 Tempo total de cálculo em segundos
(menor é melhor)
2x EPYC9754S 2x EPYC 9754 (SMT desligado) 2x EPYC 9754 (SMT ligado) 9754 SMT desligado aumento de desempenho
1 bilhões 13.480 13.56 14.573 7.50%
2.5 bilhões 23.680 23.501 28.649 17.34%
5 bilhões 40.819 40.547 50.082 18.50%
10 bilhões 78.523 77.466 93.842 16.32%
25 bilhões 206.399 206.078 236.070 12.57%
50 bilhões 483.797 482.79 521.867 7.29%
100 bilhões 1,269.484 1,266.83 1,253.446 -1.28%

Análise de Resultados

Mergulhando nas complexidades do AMD SMT, há um diálogo convincente dentro da comunidade tecnológica sobre suas implicações no desempenho do sistema. Na sua essência, o SMT parece ser uma escolha simples para aqueles que procuram um desempenho melhorado. A teoria diz: se habilitar o SMT pode levar ao dimensionamento ideal, então por que não adotá-lo como uma escolha arquitetônica benéfica?

CPU AMD Bergamo

A relação entre a eficiência do SMT e a arquitetura central não é preta e branca. O escalonamento SMT sem brilho não aponta necessariamente para uma falha em sua implementação. Na verdade, isso poderia sugerir um design de núcleo robusto que dificilmente deixa espaço para o SMT fazer uma diferença notável. Este paradoxo sublinha uma visão crucial da indústria: os fabricantes de processadores não podem reivindicar um benefício único para todos com SMT ou tecnologias semelhantes. Eles reconhecem que, embora o SMT possa extrair desempenho adicional em certos casos de uso, ele apresenta deficiências em outros cenários.

Através das lentes da computação de alto desempenho e das tarefas de supercomputação, as limitações do SMT tornam-se mais aparentes. Embora a ideia de duplicar a contagem de threads por núcleo possa parecer promissora, a realidade não é semelhante a duplicar o número de núcleos. Em casos extremos, isso pode levar a quedas de desempenho à medida que os threads disputam recursos de cache. No entanto, para a maioria das aplicações multithread, especialmente aquelas desprovidas de competição de cache, o SMT melhora o desempenho, destacando-se principalmente em tarefas que podem aproveitar plenamente o seu potencial.

Pensamentos de Encerramento

O AMD SMT é incrivelmente útil para uma ampla variedade de cargas de trabalho comuns nas empresas. Mas nem toda carga de trabalho precisa ou se beneficia do SMT. Através de nossos testes, mostramos como a AMD é capaz de aproveitar as variações na fabricação para oferecer um produto sólido com uma proposta de valor exclusiva. As organizações que projetam plataformas para tipos específicos de cargas de trabalho que precisam de núcleo puro sem SMT podem economizar um pouco de dinheiro comprando o AMD EPYC 9754S, que tem o SMT desativado permanentemente de fábrica.

Página de produto AMD

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed