AMD EPYC 9754S är designad för HPC-arbetsbelastningar med SMT inaktiverad, och levererar 128 kärnor och 128 trådar med en standard-TDP på 360W.
Förra året utökade AMD sin server-CPU-linje med 4:e generationens EPYC. Medan den 128-kärniga, 256-trådiga EPYC 9754 tog högsta fakturering, strax under den på SKU-matrisen finns AMD EPYC 9754S. Skillnaden mellan de två markerna är enkel, men ändå dramatisk. 9754S har Simultaneous Multithreading (SMT) inaktiverad. Detta innebär att 9754S levererar samma 128 kärnor som 9754, men med SMT inaktiverat, bara 128 trådar, jämfört med 256. Denna förändring ger en bra rabatt för kunder som redan inaktiverar SMT.
Modell | Kärnor | Max trådar | Standard TDP | Bas Frekv. (GHz) | Boost Frekv. (GHz) | L3-cache (MB) |
---|---|---|---|---|---|---|
9754 | 128 | 256 | 360W | 2.25 | 3.10 | 256 |
9754S | 128 | 128 | 360W | 2.25 | 3.10 | 256 |
9734 | 112 | 224 | 320W | 2.2 | 3.0 | 256 |
Vad är AMD SMT och varför finns 9754S?
Med SMT kan en enda EPYC CPU-kärna bearbeta två trådar samtidigt, detta kan leda till mer effektiv användning av processorns resurser. När en tråd väntar på att data ska laddas från minnet eller på annat sätt är inaktiv, kan den andra tråden utföra instruktioner. Detta innebär att kärnan tillbringar mindre tid i viloläge, vilket potentiellt förbättrar prestandan. Detta gäller särskilt i användningsfall som virtualisering och rendering.
Att inaktivera SMT kan tillåta tillverkare att marknadsföra dessa chips som produkter på lägre nivå, vilket säkerställer att de fortfarande uppfyller specifika prestanda- och stabilitetskriterier. CPU: er med SMT inaktiverad kan påverkas av binning-processer, marknadssegmenteringsstrategier och önskan att tillgodose specifika prestanda- eller effektivitetsbehov, vilket visar upp det nyanserade tillvägagångssättet som tillverkare tar i produktplanering och positionering.
Som sagt, inte alla arbetsbelastningar drar nytta av SMT, och många gånger kan en AMD-server ha SMT inaktiverat i BIOS. Även om det kan vara en effektiv justering, tar detta upp en annan viktig punkt. 9754S-chippet med SMT inaktiverat är lite billigare än 9754. I båda fallen kan entrådade applikationer, beräkningsbelastningar och alla användningsfall där CPU-latensen är kritiskt viktig dra fördel av att ha SMT inaktiverad.
AMD EPYC 9754S vs EPYC 9754 Prestanda
Vi vill dra två av våra vanliga tester, y-cruncher och Cinebench 2024, och se vilka prestandaskillnader vi får med och utan SMT. Vi körde 9754S och 9754 mot varandra medan vi körde 9754 med SMT på och av för att se vilka fördelar 9754S har utan SMT alls.
Testplattform och specifikationer:
- TYAN Transport HX TN85-B8261
- 512GB DDR5
- Windows Server 2022
Cinebench 2024
Först ut är Cinebench 2024, med SMT aktiverat på vår icke S-modell. Här kan vi se att vi befinner oss inom kör-till-körning variationsskillnader.
Cinebench 2024 CPU | 2x EPYC 9754S | 2x EPYC 9754 |
---|---|---|
CPU Multi-Core | 2,682 | 2,587 |
CPU enkelkärnig | 68 | 69 |
MP-förhållande | 39.19x | 37.64x |
y-cruncher valdes specifikt på grund av programmets arkitektur, placerad som ett totalt systemtest. Genom att utföra en så stor Pi-beräkning som passar in i systemminnet, syftade vi till att bevisa vår långvariga intuition att SMT kan negativt påverka CPU- och minnesbundna arbetsbelastningar. Låt oss ta en titt på resultaten först innan vi dyker in i vad det hela betyder.
y-cruncher 0.8.3
y-cruncher 0.8.3 Total beräkningstid i sekunder (lägre är bättre) |
2x EPYC 9754S | 2x EPYC 9754 (SMT av) | 2x EPYC 9754 (SMT på) | 9754 SMT Off Prestandaökning |
---|---|---|---|---|
1 miljard | 13.481 | 13.546 | 14.139 | 4.65% |
2.5 miljard | 23.818 | 24.144 | 28.111 | 15.27% |
5 miljard | 40.760 | 40.797 | 49.271 | 17.27% |
10 miljard | 77.409 | 77.959 | 95.420 | 18.88% |
25 miljard | 203.303 | 202.124 | 233.629 | 12.98% |
50 miljard | 475.557 | 476.949 | 520.349 | 8.61% |
100 miljard | 1,248.458 | 1,251.36 | 1,242.419 | -0.49% |
y-cruncher 0.8.4
y-cruncher 0.8.4 Total beräkningstid i sekunder (lägre är bättre) |
2x EPYC 9754S | 2x EPYC 9754 (SMT av) | 2x EPYC 9754 (SMT på) | 9754 SMT Off Prestandaökning |
---|---|---|---|---|
1 miljard | 13.480 | 13.56 | 14.573 | 7.50% |
2.5 miljard | 23.680 | 23.501 | 28.649 | 17.34% |
5 miljard | 40.819 | 40.547 | 50.082 | 18.50% |
10 miljard | 78.523 | 77.466 | 93.842 | 16.32% |
25 miljard | 206.399 | 206.078 | 236.070 | 12.57% |
50 miljard | 483.797 | 482.79 | 521.867 | 7.29% |
100 miljard | 1,269.484 | 1,266.83 | 1,253.446 | -1.28% |
Resultatanalys
När man dyker ner i krångligheterna med AMD SMT, finns det en övertygande dialog inom teknikgemenskapen om dess konsekvenser för systemets prestanda. I sin kärna verkar SMT vara ett enkelt val för dem som strävar efter förbättrad prestanda. Teorin lyder: om att möjliggöra SMT kan leda till idealisk skalning, varför inte anamma det som ett fördelaktigt arkitektoniskt val?
Förhållandet mellan SMT-effektivitet och kärnarkitektur är inte svart och vitt. Lackluster SMT-skalning pekar inte nödvändigtvis på ett fel i dess implementering. I själva verket kan det antyda en robust kärndesign som knappast lämnar utrymme för SMT att göra en märkbar skillnad. Denna paradox understryker en avgörande branschinsikt: processortillverkare kan inte göra anspråk på en fördel som passar alla med SMT eller liknande teknologier. De erkänner att även om SMT kan pressa ut ytterligare prestanda i vissa användningsfall, är det inte utan sina brister i andra scenarier.
Genom linsen av högpresterande datorer och superdatoruppgifter blir begränsningarna för SMT mer uppenbara. Även om idén att dubbla trådantalet per kärna kan låta lovande, är verkligheten inte som att ha dubbla kärnorna. I extrema fall kan detta leda till prestandanedgångar eftersom trådar tävlar om cacheresurser. Icke desto mindre, för de flesta flertrådade applikationer, särskilt de som saknar cachekonkurrens, lyfter SMT prestandan, främst genom uppgifter som kan utnyttja dess potential fullt ut.
Utgående Tankar
AMD SMT är otroligt användbart för en mängd olika arbetsbelastningar som är vanliga i företaget. Men inte varje arbetsbelastning behöver eller drar nytta av SMT. Genom våra tester har vi visat hur AMD kan dra fördel av variationer i tillverkningen för att leverera en solid produkt som har ett unikt värdeerbjudande. Organisationer som designar plattformar för specifika typer av arbetsbelastningar som behöver ren kärna utan SMT, kan spara lite pengar genom att köpa AMD EPYC 9754S, som har SMT inaktiverat permanent från fabriken.
Engagera dig med StorageReview
Nyhetsbrev | Youtube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Rssflöde