Inicio Empresa Revisión de AMD EPYC 9754S: una CPU con un conjunto de habilidades muy particular

Revisión de AMD EPYC 9754S: una CPU con un conjunto de habilidades muy particular

by Jordan Ranous

El AMD EPYC 9754S está diseñado para cargas de trabajo HPC con SMT deshabilitado y ofrece 128 núcleos y 128 subprocesos con un TDP predeterminado de 360 ​​W.

El año pasado, AMD amplió su línea de CPU para servidores con EPYC de cuarta generación. Si bien el EPYC 4 de 128 núcleos y 256 subprocesos ocupó el primer lugar en la facturación, justo debajo de él en la matriz de SKU se encuentra el AMD EPYC 9754S. La diferencia entre los dos chips es simple pero dramática. El 9754S tiene deshabilitado el multiproceso simultáneo (SMT). Esto significa que el 9754S ofrece los mismos 9754 núcleos que el 128, pero con SMT deshabilitado, solo 9754 subprocesos, en comparación con 128. Este cambio genera un buen descuento para los clientes que ya deshabilitan SMT.

AMD EPYC 9754S

Modelo Nucleos Subprocesos máximos TDP predeterminado frecuencia base (GHz) Refuerzo de frecuencia (GHz) Caché L3 (MB)
9754 128 256 360W 2.25 3.10 256
9754S 128 128 360W 2.25 3.10 256
9734 112 224 320W 2.2 3.0 256

¿Qué es AMD SMT y por qué existe el 9754S?

Con SMT, un único núcleo de CPU EPYC puede procesar dos subprocesos simultáneamente, lo que puede conducir a un uso más eficiente de los recursos del procesador. Cuando un subproceso está esperando que se carguen datos desde la memoria o está inactivo, el otro subproceso puede estar ejecutando instrucciones. Esto significa que el núcleo pasa menos tiempo inactivo, lo que potencialmente mejora el rendimiento. Esto es especialmente cierto en casos de uso como la virtualización y el renderizado.

Deshabilitar SMT puede permitir a los fabricantes comercializar estos chips como productos de nivel inferior, garantizando que aún cumplan con criterios específicos de rendimiento y estabilidad. Las CPU con SMT deshabilitado pueden verse influenciadas por procesos de agrupamiento, estrategias de segmentación de mercado y el deseo de satisfacer necesidades específicas de rendimiento o eficiencia, lo que muestra el enfoque matizado que adoptan los fabricantes en la planificación y el posicionamiento de productos.

Dicho esto, no todas las cargas de trabajo se benefician de SMT y, muchas veces, un servidor AMD puede tener SMT deshabilitado en el BIOS. Si bien esto puede ser un ajuste efectivo, esto trae a colación otro punto importante. El chip 9754S con SMT deshabilitado es un poco menos costoso que el 9754. En cualquier caso, las aplicaciones de un solo subproceso, las cargas de trabajo computacionales y cualquier caso de uso donde la latencia de la CPU sea de importancia crítica pueden beneficiarse de tener SMT deshabilitado.

Rendimiento de AMD EPYC 9754S frente a EPYC 9754

Queremos realizar dos de nuestras pruebas habituales, y-cruncher y Cinebench 2024, y ver qué diferencias de rendimiento obtenemos con y sin SMT. Ejecutamos 9754S y 9754 entre sí mientras encendíamos y apagamos el 9754 con SMT para ver qué ventajas tiene el 9754S sin SMT.

Plataforma de prueba y especificaciones:

Cinebench 2024

El primero es Cinebench 2024, con SMT habilitado en nuestro modelo no S. Aquí podemos ver que estamos dentro de las diferencias de variación entre ejecuciones.

CPU Cinebench 2024 2x EPYC 9754S 2x EPYC 9754
 CPU multinúcleo 2,682 2,587
 CPU de un solo núcleo 68 69
Relación MP 39.19x 37.64x

Se seleccionó y-cruncher específicamente debido a la arquitectura del programa, posicionado como una prueba total del sistema. Al realizar un cálculo de Pi tan grande que cabe en la memoria del sistema, nuestro objetivo era demostrar nuestra intuición de larga data de que SMT puede afectar negativamente las cargas de trabajo vinculadas a la CPU y la memoria. Primero echemos un vistazo a los resultados antes de profundizar en lo que significa todo esto.

y-cruncher 0.8.3

y-cruncher 0.8.3 Tiempo total de cálculo en segundos
(más bajo es mejor)
2x EPYC 9754S 2x EPYC 9754 (SMT apagado) 2x EPYC 9754 (SMT encendido) 9754 SMT apagado Aumento del rendimiento
1 mil millones 13.481 13.546 14.139 4.65%
2.5 mil millones 23.818 24.144 28.111 15.27%
5 mil millones 40.760 40.797 49.271 17.27%
10 mil millones 77.409 77.959 95.420 18.88%
25 mil millones 203.303 202.124 233.629 12.98%
50 mil millones 475.557 476.949 520.349 8.61%
100 mil millones 1,248.458 1,251.36 1,242.419 - 0.49%

y-cruncher 0.8.4

y-cruncher 0.8.4 Tiempo total de cálculo en segundos
(más bajo es mejor)
2x EPYC 9754S 2x EPYC 9754 (SMT apagado) 2x EPYC 9754 (SMT encendido) 9754 SMT apagado Aumento del rendimiento
1 mil millones 13.480 13.56 14.573 7.50%
2.5 mil millones 23.680 23.501 28.649 17.34%
5 mil millones 40.819 40.547 50.082 18.50%
10 mil millones 78.523 77.466 93.842 16.32%
25 mil millones 206.399 206.078 236.070 12.57%
50 mil millones 483.797 482.79 521.867 7.29%
100 mil millones 1,269.484 1,266.83 1,253.446 - 1.28%

Análisis de resultados

Al profundizar en las complejidades de AMD SMT, existe un diálogo convincente dentro de la comunidad tecnológica sobre sus implicaciones en el rendimiento del sistema. En esencia, SMT parece ser una opción sencilla para quienes buscan un rendimiento mejorado. La teoría dice: si habilitar SMT puede conducir a un escalamiento ideal, ¿por qué no adoptarlo como una opción arquitectónica beneficiosa?

CPU AMD Bérgamo

La relación entre la eficiencia SMT y la arquitectura central no es blanca o negra. El escalamiento mediocre de SMT no necesariamente indica una falla en su implementación. De hecho, podría insinuar un diseño central robusto que apenas deja espacio para que SMT marque una diferencia notable. Esta paradoja subraya una idea crucial de la industria: los fabricantes de procesadores no pueden reclamar un beneficio único para todos con SMT o tecnologías similares. Reconocen que si bien SMT puede obtener un rendimiento adicional en ciertos casos de uso, no está exento de deficiencias en otros escenarios.

A través de la lente de las tareas de computación y supercomputación de alto rendimiento, las limitaciones de SMT se vuelven más evidentes. Si bien la idea de duplicar el número de subprocesos por núcleo puede parecer prometedora, la realidad no es similar a tener el doble de núcleos. En casos extremos, esto puede provocar caídas en el rendimiento a medida que los subprocesos compiten por los recursos de caché. No obstante, para la mayoría de las aplicaciones multiproceso, especialmente aquellas que carecen de competencia de caché, SMT aumenta el rendimiento, destacando principalmente en tareas que pueden aprovechar al máximo su potencial.

Pensamientos Finales

AMD SMT es increíblemente útil para una amplia variedad de cargas de trabajo comunes en la empresa. Pero no todas las cargas de trabajo necesitan o se benefician de SMT. A través de nuestras pruebas, hemos demostrado cómo AMD puede aprovechar las variaciones en la fabricación para ofrecer un producto sólido que tiene una propuesta de valor única. Las organizaciones que diseñan plataformas para tipos específicos de cargas de trabajo que necesitan núcleo puro sin SMT pueden ahorrar un poco de dinero comprando el AMD EPYC 9754S, que tiene SMT desactivado permanentemente de fábrica.

Página del producto AMD

Interactuar con StorageReview

BOLETÍN  | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed