O AMD EPYC 9754S foi projetado para cargas de trabalho de HPC com SMT desabilitado, oferecendo 128 núcleos e 128 threads com um TDP padrão de 360W.
No ano passado, a AMD expandiu sua linha de CPUs para servidores com EPYC de 4ª geração. Embora o EPYC 128 de 256 núcleos e 9754 threads tenha sido o mais vendido, logo abaixo dele na matriz SKU está o AMD EPYC 9754S. A diferença entre os dois chips é simples, mas dramática. O 9754S tem o Multithreading Simultâneo (SMT) desabilitado. Isso significa que o 9754S oferece os mesmos 128 núcleos que o 9754, mas com o SMT desabilitado, apenas 128 threads, em comparação com 256. Essa mudança traz um bom desconto para clientes que já desabilitam o SMT.
Modelo | Núcleos | Tópicos Máximos | TDP padrão | Freq. base (GHz) | Aumente a Freq. (GHz) | Cache L3 (MB) |
---|---|---|---|---|---|---|
9754 | 128 | 256 | 360W | 2.25 | 3.10 | 256 |
9754S | 128 | 128 | 360W | 2.25 | 3.10 | 256 |
9734 | 112 | 224 | 320W | 2.2 | 3.0 | 256 |
O que é AMD SMT e por que existe o 9754S?
Com o SMT, um único núcleo de CPU EPYC pode processar dois threads simultaneamente, o que pode levar a um uso mais eficiente dos recursos do processador. Quando um thread está aguardando o carregamento de dados da memória ou está ocioso, o outro thread pode estar executando instruções. Isso significa que o núcleo passa menos tempo ocioso, melhorando potencialmente o desempenho. Isto é especialmente verdadeiro em casos de uso como virtualização e renderização.
Desativar o SMT pode permitir que os fabricantes comercializem esses chips como produtos de nível inferior, garantindo que ainda atendam a critérios específicos de desempenho e estabilidade. CPUs com SMT desativado podem ser influenciadas por processos de categorização, estratégias de segmentação de mercado e pelo desejo de atender a necessidades específicas de desempenho ou eficiência, mostrando a abordagem diferenciada que os fabricantes adotam no planejamento e posicionamento de produtos.
Dito isso, nem todas as cargas de trabalho se beneficiam do SMT e, muitas vezes, um servidor AMD pode ter o SMT desabilitado no BIOS. Embora isso possa ser um ajuste eficaz, traz à tona outro ponto importante. O chip 9754S com SMT desativado é um pouco mais barato que o 9754. Em qualquer caso, aplicativos de thread único, cargas de trabalho computacionais e quaisquer casos de uso em que a latência da CPU seja extremamente importante podem se beneficiar com a desativação do SMT.
Desempenho AMD EPYC 9754S vs EPYC 9754
Queremos realizar dois de nossos testes regulares, y-cruncher e Cinebench 2024, e ver quais diferenças de desempenho obtemos com e sem SMT. Executamos o 9754S e o 9754 um contra o outro enquanto executamos o 9754 com o SMT ativado e desativado para ver quais vantagens o 9754S tem sem o SMT.
Plataforma de teste e especificações:
- Transporte TYAN HX TN85-B8261
- 512GB DDR5
- Servidor 2022 do Windows
Cinebench 2024
O primeiro é o Cinebench 2024, com SMT habilitado em nosso modelo não S. Aqui podemos ver que estamos dentro das diferenças de variação entre corridas.
Processador Cinebench 2024 | 2x EPYC9754S | 2x EPYC9754 |
---|---|---|
CPU multinúcleo | 2,682 | 2,587 |
CPU de núcleo único | 68 | 69 |
Taxa de MP | 39.19x | 37.64x |
O y-cruncher foi selecionado especificamente por causa da arquitetura do programa, posicionado como um teste total do sistema. Realizando um cálculo de Pi tão grande que cabe na memória do sistema, nosso objetivo é provar nossa intuição de longa data, de que o SMT pode impactar negativamente as cargas de trabalho vinculadas à CPU e à memória. Vamos dar uma olhada nos resultados antes de mergulhar no que tudo isso significa.
triturador de y 0.8.3
y-cruncher 0.8.3 Tempo total de cálculo em segundos (menor é melhor) |
2x EPYC9754S | 2x EPYC 9754 (SMT desligado) | 2x EPYC 9754 (SMT ligado) | 9754 SMT desligado aumento de desempenho |
---|---|---|---|---|
1 bilhões | 13.481 | 13.546 | 14.139 | Um CAC |
2.5 bilhões | 23.818 | 24.144 | 28.111 | Um CAC |
5 bilhões | 40.760 | 40.797 | 49.271 | Um CAC |
10 bilhões | 77.409 | 77.959 | 95.420 | Um CAC |
25 bilhões | 203.303 | 202.124 | 233.629 | Um CAC |
50 bilhões | 475.557 | 476.949 | 520.349 | Um CAC |
100 bilhões | 1,248.458 | 1,251.36 | 1,242.419 | -0.49% |
triturador de y 0.8.4
y-cruncher 0.8.4 Tempo total de cálculo em segundos (menor é melhor) |
2x EPYC9754S | 2x EPYC 9754 (SMT desligado) | 2x EPYC 9754 (SMT ligado) | 9754 SMT desligado aumento de desempenho |
---|---|---|---|---|
1 bilhões | 13.480 | 13.56 | 14.573 | Um CAC |
2.5 bilhões | 23.680 | 23.501 | 28.649 | Um CAC |
5 bilhões | 40.819 | 40.547 | 50.082 | Um CAC |
10 bilhões | 78.523 | 77.466 | 93.842 | Um CAC |
25 bilhões | 206.399 | 206.078 | 236.070 | Um CAC |
50 bilhões | 483.797 | 482.79 | 521.867 | Um CAC |
100 bilhões | 1,269.484 | 1,266.83 | 1,253.446 | -1.28% |
Análise de Resultados
Mergulhando nas complexidades do AMD SMT, há um diálogo convincente dentro da comunidade tecnológica sobre suas implicações no desempenho do sistema. Na sua essência, o SMT parece ser uma escolha simples para aqueles que procuram um desempenho melhorado. A teoria diz: se habilitar o SMT pode levar ao dimensionamento ideal, então por que não adotá-lo como uma escolha arquitetônica benéfica?
A relação entre a eficiência do SMT e a arquitetura central não é preta e branca. O escalonamento SMT sem brilho não aponta necessariamente para uma falha em sua implementação. Na verdade, isso poderia sugerir um design de núcleo robusto que dificilmente deixa espaço para o SMT fazer uma diferença notável. Este paradoxo sublinha uma visão crucial da indústria: os fabricantes de processadores não podem reivindicar um benefício único para todos com SMT ou tecnologias semelhantes. Eles reconhecem que, embora o SMT possa extrair desempenho adicional em certos casos de uso, ele apresenta deficiências em outros cenários.
Através das lentes da computação de alto desempenho e das tarefas de supercomputação, as limitações do SMT tornam-se mais aparentes. Embora a ideia de duplicar a contagem de threads por núcleo possa parecer promissora, a realidade não é semelhante a duplicar o número de núcleos. Em casos extremos, isso pode levar a quedas de desempenho à medida que os threads disputam recursos de cache. No entanto, para a maioria das aplicações multithread, especialmente aquelas desprovidas de competição de cache, o SMT melhora o desempenho, destacando-se principalmente em tarefas que podem aproveitar plenamente o seu potencial.
Pensamentos de Encerramento
O AMD SMT é incrivelmente útil para uma ampla variedade de cargas de trabalho comuns nas empresas. Mas nem toda carga de trabalho precisa ou se beneficia do SMT. Através de nossos testes, mostramos como a AMD é capaz de aproveitar as variações na fabricação para oferecer um produto sólido com uma proposta de valor exclusiva. As organizações que projetam plataformas para tipos específicos de cargas de trabalho que precisam de núcleo puro sem SMT podem economizar um pouco de dinheiro comprando o AMD EPYC 9754S, que tem o SMT desativado permanentemente de fábrica.
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed