Hem Företag 4:e generationens AMD EPYC Review (AMD Genoa)

4:e generationens AMD EPYC Review (AMD Genoa)

by Jordan Ranous

AMD har meddelat den allmänna tillgängligheten för de nya EPYC 9004 4:e generationens processorer. Kodnamnet AMD Genoa, den nya serien av processorer stöder 12 kanaler med DDR5-4800 (upp till 6 TB minneskapacitet per sockel), 128 banor av PCIe Gen5, AMD Infinity Fabric/Guard-teknik och upp till 96 kärnor. Detta gör dem idealiska för kritiska arbetsbelastningar över moln, företag och högpresterande datorer.

AMD har meddelat den allmänna tillgängligheten för de nya EPYC 9004 4:e generationens processorer. Kodnamnet AMD Genoa, den nya serien av processorer stöder 12 kanaler med DDR5-4800 (upp till 6 TB minneskapacitet per sockel), 128 banor av PCIe Gen5, AMD Infinity Fabric/Guard-teknik och upp till 96 kärnor. Detta gör dem idealiska för kritiska arbetsbelastningar över moln, företag och högpresterande datorer.

Fördelar med EPYC 9004 4:e generationens CPU:er för företag

Med sitt enorma antal 96 kärnor i en enda processor kommer de nya AMD Genoa-processorerna att tillåta organisationer att minska sitt fysiska fotavtryck genom att distribuera färre servrar samtidigt som de utnyttjar kraftfullare servrar. Detta ger större flexibilitet till datacenterekosystem och hjälper dem att nå hållbarhet och framtidssäkra mål.

AMD Genoa server

AMD byggde sina nya EPYC-processorer med ett enormt fokus på förbättrad säkerhet, särskilt med att utöka AMD Infinity Guard, företagets uppsättning funktioner som erbjuder både fysiska och virtuella skyddslager för sina CPU:er. Till exempel har den dubbelt så många krypteringsnycklar jämfört med tidigare generationer, vilket hjälper kunder att hålla sin data säker oavsett om den lagras lokalt, i molnet eller finns i lagring.

Organisationer kommer att kunna dra nytta av deras "allt-in"-funktioner, med alternativ att välja en modell med kärnantalet och frekvensen (se tabellen nedan) som bäst passar deras behov. Dessutom stöder 4:e generationens AMD EPYC-processorer nu DDR5-minne och PCIe Gen 5, som båda är viktiga för AI- och ML-applikationer. Naturligtvis satsar SSD-leverantörer på företaget för att få ut sina enheter till mainstream, och låser upp dubbelt så mycket bandbreddspotential som Gen 4.

SKU:er i AMD Genoa 9004-serien

Modell Kärnor Standard TDP cTDP Bas (GHz) Boost (GHz)
9654 96 360w 320-400w 2.4 3.7
9634 84 290w 240-300w 2.25 3.7
9554 64 360w 320-400w 3.1 3.75
9534 64 280w 240-300w 2.45 3.7
9454 48 290w 240-300w 2.75 3.8
9354 32 280w 240-300w 3.25 3.8
9334 32 210w 200-240w 2.7 3.9
9254 24 200w 200-240w 2.9 4.15
9224 24 200w 200-240w 2.5 3.7
9124 16 200w 200-240w 3.0 3.7
9474F 48 360w 320-400w 3.6 4.1
9374F 32 320w 320-400w 3.85 4.3
9274F 24 320w 320-400w 4.05 4.3
9174F 16 320w 320-400w 4.1 4.4
9654P 96 360w 320-400w 2.4 3.7
9554P 64 360w 320-400w 3.1 3.75
9454P 48 290w 240-300w 2.75 3.8
9354P 32 280w 240-300w 3.25 3.8

AMD Genoa – Zen 4-arkitektur

Zen 4, som släpptes i september, är den nya mikroarkitekturen för AMD EPYC 9004-processorerna, med AMD:s högsta prestandakärna hittills. Detta hjälper EPYC 9004-processorer att leverera nya nivåer av ledarskap inom prestanda och energieffektivitet och gör det möjligt för kunder att påskynda moderniseringen av datacenter för större applikationsgenomströmning och mer handlingskraftiga insikter. Zen 4 driver också deras nya konsumentklassade Ryzen 7000 stationära processorer.

amd genoa DRAM

En av de större förändringarna Zen 4 för med sig är att den inte längre stöder DDR4-minne, eftersom den har flyttat enbart till endast DDR5. Dessutom stöder Zen 4 nya AMD EXPO SPD-profiler, vilket möjliggör mer omfattande minnesinställning och överklockning av RAM-tillverkare.

Några av de andra nya funktionerna inkluderar:

  • Snabb privat 1M L2-cache
  • Fler enastående missar stöds från L2 till L3 per kärna
  • Fler enastående missar stöds från L3 till minne
  • Förbättrad L3 och L2 miss BW
  • Högre BW möjliggör förhämtningsförbättringar

Zen 4 mikroarkitektur översikt

Zen 4 mot Zen 3

AMD EPYC 9004-seriens förbättringar jämfört med tidigare generationer

Nya AMD Genoa erbjuder en rad märkbara förbättringar, inklusive en ökning av det maximala antalet kärnor till hela 96 per CPU. Detta är betydande jämfört med de senaste generationerna:

  • Maximal 64 kärnor per CPU med 7773X och 7763 (3rd Gen EPYC) modeller
  • Maximal 40 kärnor per CPU med 8380 (3rd Gen Xeon Platinum) modell

AMD indikerar att detta kommer att översättas till ungefär 2.3x prestanda jämfört med konkurrenterna (eller 1.6x för prestanda per watt) när det kommer till snabbare tid till lösningar. Detta kommer att vara det största uppsvinget i övergripande prestanda vi har sett från deras nästa generations releaser. För företagsverksamhet per sekund, den 4th Gen AMD förväntar sig att deras EPYC-processorer ska erbjuda ~2.6x prestanda samtidigt som de antyder en 2.4x prestandaökning i renderingshastigheter när man använder Arnold Autodesk.

amd genoa heatsync

Den erbjuder också en betydande uppgradering av kärnprestanda på grund av Zen 4-arkitekturen och en potentiell ökning med ~14 procent av IPC-höjningen för server-CPU:er.

Den nya EPYC 9004-serien har också kapacitet för ledarskapsplattformar som tillhandahålls för skalning:

  • 12-kanals DDR5-4800 med förbättrad enrankad prestanda
  • 128L 32Gps och 8L 8Gps multifunktions SERDES (serializer/deserializer)

Dessutom har den CXL1.1+ minnesstöd (CXL "Type3"), som inkluderar avancerad minnesanslutningskapacitet för DDR och nya minne, samt SEV-SNP, QoS och minneshanteringstillägg i nivåer. För ökad säkerhet stöder den SEV-SNP-nyckeltillägg och AES-256-XTS.

AMD EPYC 9004-seriens minne

AMD Genoa-processorerna stöder 12-kanaler per CPU, 6TB per sockelkapacitet, upp till DDR4800, och kan teoretiskt nå upp till 460 GB/s i toppbandbredd.

Här är en överblick över jämförelserna mellan 3:e och 4:e generationens minnesbandbreddsprestanda:

AMD EPYC 9004-serien CPU-positionering

Liksom i deras tidigare generation har AMD kategoriserat sina nya processorer i tre olika grupper:

  • Kärnprestanda, som består av högfrekventa processorer med ett stort cache/kärnförhållande. Modeller som faller under detta inkluderar 9474F (48 kärnor @ 360W), 9374F (32 kärnor @ 320W), 9274F (24 kärnor @ 320W) och 9174F (16 kärnor @ 320W).
  • Kärndensitet, som består av de högsta kärn- och trådantal CPU:erna. Modeller som faller under detta inkluderar 9654/P (96 kärnor @ 360W), 9634 (84 kärnor @ 290W), 9554/P (64 kärnor @ 360W), 9534 (64 kärnor @ 280W) och 9454/P (48W) ).
  • Balanserad och optimerad prestanda, som består av processorer som har en balans mellan prestanda och TCO. Modeller som faller under detta inkluderar 9354/P (32 kärnor @ 280W), 9334 (32 kärnor @ 210W), 9254 (24 kärnor @ 200W), 9224 (24 kärnor @ 200W) och 9124 (16 kärnor @ 200W).

AMD Genoa 9004 CPU-prestanda

Benchmarking-konfiguration

För våra första tester placerade vi de nuvarande toppmoderna Intel- och AMD-plattformarna mot varandra i en första sats av CPU-intensiva arbetsbelastningar. För vår Intel-plattform utnyttjade vi vår initiala Intel 8380-plattform med dubbla processorer byggd kring en Intel OEM-server mot vår AMD EPYC 9654-plattform med dubbla processorer inuti ett Quanta-chassi.

Intel-plattformsspecifikationer:
2 x Intel Xeon Platinum 8380 40-kärniga processorer
16 x 32 GB 3200MHz DDR4
Windows Server 2022 OS

AMD-plattformsspecifikationer:
2 x AMD EPYC 9654 96-kärniga processorer
24 x 64 GB 4800MHz DDR5
Windows Server 2022 OS

V-Ray

V-Ray Benchmark är en applikation från Chaos Group för att göra poäng och jämföra olika CPU:er och GPU:er. Chaos Group är känt för sitt arbete kring visualiseringar och rendering som specialiserat sig på strålspårningsteknik. V-Ray Benchmark innehåller en skräddarsydd testscen för att testa valfri kombination av CPU och GPU och jämföra ett systems prestanda med ett annat.

I vårt labb använde vi V-Ray benchmark i endast CPU-läget. För att minimera eventuella flaskhalsar använde vi en Solidigm P5520 7.68TB NVMe SSD och en ren installation av Windows Server 2022. Toppen av topplistan för V-Ray var tidigare ett 2x AMD EPYC 7K83 64-kärnigt processorsystem som fick en imponerande 100,844 6 genomsnitt över 2 tester. Vårt provsystem med 96x AMD EPYC Genoa 126,940-Core fick ett genomsnitt på 9 XNUMX i XNUMX tester. Jämfört med Intel-systemet

Firefox Bygg från källa

Firefox, webbläsaren från Mozilla, är ett enormt projekt med öppen källkod. Mozilla vill gärna erbjuda dig möjligheten att själv kompilera projektet från källkod, något som har blivit mer allmänt förekommande som ett verktyg för att jämföra prestanda. Nedladdningen för detta är i flera gigabyte med tusentals filer som behöver kompileras.

I våra tester var vi mer än imponerade av 6-minuters- och 57-sekunderstiden för Intel Xeon 8380-riggen, det var tills vi avfyrade den på Genoa-riggen, som kom in på vansinnigt snabba 6-minuters 33- andra kompileringstiden. Som jämförelse, en arbetsstation i toppskiktet kommer att kunna slutföra denna uppgift på knappt under 10 minuter om du matar den med en jämn diet av flytande kväve och överspänning, vilket betyder att vi har att göra med några allvarliga råa hästkrafter utanför porten med dessa marker.

FF Bygg från källa
2 x AMD 9654 96-Core 6:33.85
2 x Intel 8380 40-kärnor 6:57.85

Blender – CLI benchmark

Blender Benchmark är en etablerad standard inom CPU- och GPU-benchmarking-scenen. Blender är ett 3D-modellerings- och animeringsverktyg med öppen källkod som är mycket avancerat och anses vara en ledare i rymden. I överensstämmelse med temat för Genoa EPYC-processorer använder vi det för att visa upp flexibiliteten i att ha en blandad arkitektur som är kapabel till en CPU och en potentiell GPU-stand-in för högdensitetsrackinstallationer.

Blender har tre riktmärken, känd som Monster, Junkshop och Classroom. Det här är tre scener som renderas sekventiellt och ges en poäng för varje avsnitt, som sedan läggs ihop för en total poäng.

Blendertest 2 x AMD 9654 96-Core 2 x Intel 8380 40-kärnor
Monster 1788.189128 671.145395
Junkshop 1062.533142 407.141514
Klassrum 850.646333 320.507039
Totalt 3701.368603 1398.793948

Genua-riggen fick ett förkrossande 3701 totalt, med 1788.2 i Monster, 1062.5 i Junkshop och 850.6 på Classroom benchmark. Att jämföra Genoa med Intel Xeon Platinum kan tyckas orättvist på vissa sätt, med tanke på att Intel bara kommer att slå med cirka 41 procent av kärnantalet, men om vi tittar på data och normaliserar för skillnaden i kärnantalet, blir resultaten intressanta . AMD Genoa Chip, tack vare sin nyare arkitektur, instruktionsuppsättningar och användning av DDR5, är cirka 10 procent snabbare än Intel-riggen.

2 x AMD 9654 96-Core Relativ Intel Core Count Procent 2 x Intel 8380 40-kärnor
192 Core 41.67 procent 80 Core
384 Thread 41.67 procent 160 Thread

 

2 x AMD 9654 96-Core 2 x Intel 8380 40-kärnor
Blender totalt resultat 3701 1399
Kärnor / trådar 192/384 80/160
Intel Core Count/AMD 41.67 procent
Direkt resultatjämförelse Intel/AMD 37.79 procent
Kärnnormaliserad AMD-poäng 1542
Relativ Intel/AMD, Core Normalized 90.70 procent

Cinebench R23

Cinebench by Maxon har varit en stöttepelare i benchmarking under en tid nu, tack vare dess standardiserade testmetodik och användningen av verkliga tester för att jämföra multicore och single-core prestanda. R23, den senaste versionen av Cinebench, har en begränsning som vi inte har behövt kringgå tidigare; Den kan endast benchmarka 256 kärnor/trådar. Vår testrigg har 384. Intressant nog fanns det många "standard" riktmärken och applikationer som vi stötte på som var kärnbegränsade till 256, så Cinebench är inte ensam om att behöva en uppdatering för den framtid med ultrakärnräkning vi är på väg mot mot.

För att försöka ta itu med denna begränsning körde vi två tester samtidigt och begränsade varje instans till 196 trådar för att försöka fördela belastningen jämnt. Vanligtvis kan du ställa in CPU-affiniteten i Aktivitetshanteraren, men något blockerade denna operation med Cinebench, vi misstänker att det är en flagga som har ställts in på det underliggande sättet som API anropas för CPU-prioritet. Vi försökte köra den som mindre privilegierade användare och startade med kommandoraden "start /affinity NODE 0"-flaggan för att försöka tvinga den, men kunde inte låsa applikationen till en enda NUMA-nod.

Det gick inte att tilldela en specifik affinitet för programmet, vi körde bara programmet två gånger och startade dem tillsammans. Resultaten visade två drastiskt olika poäng från de två instanserna av appen, men när vi övervakade CPU-användningen kunde vi observera att den studsade mellan 80 -100 procents utnyttjande under testet.

Cinebench Single Instance 2 x AMD 9654 96-Core 2 x Intel 8380 40-kärnor
Flertrådig (256 kap) 85,160 70,540
Enda kärna 972 985
MP-förhållande 87.65x 71.63x

 

2 Cinebench-instanser
AMD testkörning 1 AMD testkörning 2
Poäng, 1:a instans 82,063 68,231
Betyg, 2:a instans 57,557 57,221
Totalt 139,620 125,452

Avslutande tankar

Benchmarking-processen för AMD EPYC 9004-processorerna har varit en minst sagt intressant övning. Utmaningarna som vi stod inför i den tidiga granskningen är indikativa för de övergripande utmaningar som mjukvaruutvecklare kommer att behöva ta itu med när CPU-landskapet övergår till modellen med ultrahög densitet. Även om det finns några vanliga applikationer som kan använda det, hittade vi allt oftare gränser för programvara som inte kunde skala förbi vissa trösklar för trådantal.

I labbet arbetar vi med några hemmagjorda Tensorflow Machine Learning-riktmärken för att kunna testa dessa nya CPU:er i verkliga scenarier. Vi kommer att följa upp resultaten när vi har förtroende för resultaten av den nya applikationen och har validerat den över flera plattformar och generationer av CPU:er.

För nu är dock lanseringen av AMD Genoa väldigt spännande som vi hittills har sett med Quanta-servern. Plus, HPE och Dell har tillkännagett sina servrar, som var och en erbjuder fyra system, två 1 CPU-chassi och två 2 CPU-chassier. Detta kommer att ta AMD Genoa till företaget omedelbart, och snabbt expandera Genuas fotavtryck förbi bara hyperscalers.

amd genoa bare cpu

Den stora frågan är då uppenbar, är AMD Genoa värt investeringen? Detta kommer att komma ner till arbetsbelastningen när det gäller att motivera utgifterna, men precis som DPU:er för VMware, dessa nya CPU-tekniker har mycket att erbjuda när det gäller datorkraft, säkerhet och effektivitet. Att ersätta 3rd Gen EPYC med dessa är förmodligen lite för tidigt, men alla som har väntat på en anledning att hoppa borde vara mycket glada över att se vad Genoa har tillfört bordet.

Vi har mycket mer att testa och jobba på och med Intel Sapphire Rapids som kommer snart vill vi jämföra det bästa som var och en har att erbjuda. Men för tillfället är AMD Genoa extremt övertygande och bör vara i alla infrastrukturuppdateringar PoC så att organisationer bättre kan förstå effekten av alla dessa kärnor och effektivitet som AMD har att erbjuda.

AMD lanseringsvideo

Engagera dig med StorageReview

Nyhetsbrev | Youtube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Rssflöde