Startseite Unternehmen AMD EPYC 9754S Test – Eine CPU mit ganz besonderen Fähigkeiten

AMD EPYC 9754S Test – Eine CPU mit ganz besonderen Fähigkeiten

by Jordan Ranous

Der AMD EPYC 9754S ist für HPC-Workloads mit deaktiviertem SMT konzipiert und liefert 128 Kerne und 128 Threads mit einer Standard-TDP von 360 W.

Letztes Jahr hat AMD seine Server-CPU-Reihe um EPYC der 4. Generation erweitert. Während der EPYC 128 mit 256 Kernen und 9754 Threads an erster Stelle stand, liegt in der SKU-Matrix knapp darunter der AMD EPYC 9754S. Der Unterschied zwischen den beiden Chips ist einfach, aber dennoch dramatisch. Beim 9754S ist Simultaneous Multithreading (SMT) deaktiviert. Das bedeutet, dass der 9754S die gleichen 128 Kerne wie der 9754 liefert, aber bei deaktiviertem SMT nur 128 Threads im Vergleich zu 256. Diese Änderung bringt einen schönen Rabatt für Kunden mit sich, die SMT bereits deaktiviert haben.

AMD EPYC 9754S

Modell Farben Maximale Threads Standard-TDP Basisfrequenz. (GHz) Boost-Frequenz. (GHz) L3-Cache (MB)
9754 128 256 360W 2.25 3.10 256
9754S 128 128 360W 2.25 3.10 256
9734 112 224 320W 2.2 3.0 256

Was ist AMD SMT und warum gibt es den 9754S?

Mit SMT kann ein einzelner EPYC-CPU-Kern zwei Threads gleichzeitig verarbeiten, was zu einer effizienteren Nutzung der Prozessorressourcen führen kann. Wenn ein Thread darauf wartet, dass Daten aus dem Speicher geladen werden, oder sich anderweitig im Leerlauf befindet, kann der andere Thread Anweisungen ausführen. Dies bedeutet, dass der Kern weniger Zeit im Leerlauf verbringt, was möglicherweise die Leistung verbessert. Dies gilt insbesondere für Anwendungsfälle wie Virtualisierung und Rendering.

Durch die Deaktivierung von SMT können Hersteller diese Chips als Produkte der unteren Preisklasse vermarkten und so sicherstellen, dass sie weiterhin bestimmte Leistungs- und Stabilitätskriterien erfüllen. CPUs mit deaktiviertem SMT können durch Binning-Prozesse, Marktsegmentierungsstrategien und den Wunsch, auf bestimmte Leistungs- oder Effizienzanforderungen einzugehen, beeinflusst werden, was den differenzierten Ansatz der Hersteller bei der Produktplanung und -positionierung verdeutlicht.

Allerdings profitiert nicht jeder Workload von SMT, und oft ist SMT im BIOS eines AMD-Servers deaktiviert. Das kann zwar eine effektive Optimierung sein, wirft aber einen weiteren wichtigen Punkt auf. Der 9754S-Chip mit deaktiviertem SMT ist etwas günstiger als der 9754. In jedem Fall können Single-Thread-Anwendungen, Rechenlasten und alle Anwendungsfälle, bei denen die CPU-Latenz von entscheidender Bedeutung ist, von der Deaktivierung von SMT profitieren.

AMD EPYC 9754S vs. EPYC 9754 Leistung

Wir möchten zwei unserer regulären Tests, Y-Cruncher und Cinebench 2024, heranziehen und sehen, welche Leistungsunterschiede wir mit und ohne SMT erzielen. Wir haben 9754S und 9754 gegeneinander getestet, während wir den 9754 mit ein- und ausgeschaltetem SMT betrieben haben, um zu sehen, welche Vorteile der 9754S ohne SMT hat.

Testplattform und Spezifikationen:

Cinebench 2024

An erster Stelle steht Cinebench 2024 mit aktiviertem SMT auf unserem Nicht-S-Modell. Hier können wir sehen, dass wir innerhalb der Variationsunterschiede von Lauf zu Lauf liegen.

Cinebench 2024-CPU 2x EPYC 9754S 2x EPYC 9754
 CPU-Mehrkern 2,682 2,587
 CPU Single-Core 68 69
MP-Verhältnis 39.19x 37.64x

Y-Cruncher wurde speziell aufgrund der Architektur des Programms ausgewählt, das als Gesamtsystemtest positioniert ist. Mit der Durchführung einer so großen Pi-Berechnung, die in den Systemspeicher passt, wollten wir unsere langjährige Intuition beweisen, dass sich SMT negativ auf CPU- und speichergebundene Arbeitslasten auswirken kann. Werfen wir zunächst einen Blick auf die Ergebnisse, bevor wir näher darauf eingehen, was das alles bedeutet.

Y-Cruncher 0.8.3

y-cruncher 0.8.3 Gesamtrechenzeit in Sekunden
(weniger ist besser)
2x EPYC 9754S 2x EPYC 9754 (SMT aus) 2x EPYC 9754 (SMT an) 9754 SMT-Off-Leistungssteigerung
1 Milliarden 13.481 13.546 14.139 4.65%
2.5 Milliarden 23.818 24.144 28.111 15.27%
5 Milliarden 40.760 40.797 49.271 17.27%
10 Milliarden 77.409 77.959 95.420 18.88%
25 Milliarden 203.303 202.124 233.629 12.98%
50 Milliarden 475.557 476.949 520.349 8.61%
100 Milliarden 1,248.458 1,251.36 1,242.419 -0.49%

Y-Cruncher 0.8.4

y-cruncher 0.8.4 Gesamtrechenzeit in Sekunden
(weniger ist besser)
2x EPYC 9754S 2x EPYC 9754 (SMT aus) 2x EPYC 9754 (SMT an) 9754 SMT-Off-Leistungssteigerung
1 Milliarden 13.480 13.56 14.573 7.50%
2.5 Milliarden 23.680 23.501 28.649 17.34%
5 Milliarden 40.819 40.547 50.082 18.50%
10 Milliarden 78.523 77.466 93.842 16.32%
25 Milliarden 206.399 206.078 236.070 12.57%
50 Milliarden 483.797 482.79 521.867 7.29%
100 Milliarden 1,269.484 1,266.83 1,253.446 -1.28%

Ergebnisanalyse

Wenn man sich mit den Feinheiten von AMD SMT befasst, gibt es innerhalb der Tech-Community einen fesselnden Dialog über seine Auswirkungen auf die Systemleistung. Im Kern scheint SMT eine einfache Wahl für diejenigen zu sein, die eine höhere Leistung anstreben. Die Theorie lautet: Wenn die Aktivierung von SMT zu einer idealen Skalierung führen kann, warum sollte man sie dann nicht als vorteilhafte architektonische Wahl betrachten?

AMD Bergamo-CPU

Der Zusammenhang zwischen SMT-Effizienz und Kernarchitektur ist nicht schwarz und weiß. Eine glanzlose SMT-Skalierung weist nicht unbedingt auf einen Fehler in der Implementierung hin. Tatsächlich könnte es auf ein robustes Kerndesign hinweisen, das SMT kaum Platz lässt, um einen spürbaren Unterschied zu machen. Dieses Paradoxon unterstreicht eine entscheidende Branchenerkenntnis: Prozessorhersteller können bei SMT oder ähnlichen Technologien keinen Pauschalvorteil für sich beanspruchen. Sie erkennen an, dass SMT zwar in bestimmten Anwendungsfällen zusätzliche Leistung herausholen kann, in anderen Szenarien jedoch nicht ohne Mängel ist.

Durch die Linse von Hochleistungsrechnen und Supercomputing-Aufgaben werden die Grenzen von SMT deutlicher. Auch wenn die Idee einer Verdoppelung der Thread-Anzahl pro Kern vielversprechend klingt, ist die Realität nicht mit einer Verdoppelung der Kerne vergleichbar. In extremen Fällen kann dies zu Leistungseinbußen führen, da Threads um Cache-Ressourcen konkurrieren. Dennoch steigert SMT bei den meisten Multithread-Anwendungen, insbesondere solchen ohne Cache-Konkurrenz, die Leistung und glänzt vor allem bei Aufgaben, bei denen das Potenzial voll ausgeschöpft werden kann.

Abschließende Gedanken

AMD SMT ist unglaublich nützlich für eine Vielzahl von Arbeitslasten, die im Unternehmen häufig vorkommen. Aber nicht jede Arbeitslast benötigt oder profitiert von SMT. Durch unsere Tests haben wir gezeigt, wie AMD in der Lage ist, Fertigungsunterschiede zu nutzen, um ein solides Produkt mit einem einzigartigen Wertversprechen zu liefern. Unternehmen, die Plattformen für bestimmte Arten von Workloads entwickeln, die Pure-Core ohne SMT benötigen, können durch den Kauf des AMD EPYC 9754S, bei dem SMT ab Werk dauerhaft deaktiviert ist, etwas Geld sparen.

AMD-Produktseite

Beteiligen Sie sich an StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed