Hem Företag AMD Bergamo/Genua-X recension

AMD Bergamo/Genua-X recension

by Jordan Ranous

I juni tillkännagav AMD uppdateringar till sin 4:e generationens AMD EPYC-familj av processorer utformade för specialiserade arbetsbelastningar som behövs för att möta företagens krav. Tillkännagivandena gjordes under öppningen av AMD:s datacenter och AI Technology Premiere med avtäckningen av 4:e generationens AMD EPYC 97X4-processorer, tidigare kodnamnet AMD Bergamo. AMD EPYC 97X4-processorerna ger större vCPU-densitet och ökad prestanda inriktad på AI-applikationer och applikationer som körs i molnet.

I juni tillkännagav AMD uppdateringar till sin 4:e generationens AMD EPYC-familj av processorer utformade för specialiserade arbetsbelastningar som behövs för att möta företagens krav. Tillkännagivandena gjordes under öppningen av AMD:s datacenter och AI Technology Premiere med avtäckningen av 4:e generationens AMD EPYC 97X4-processorer, tidigare kodnamnet AMD Bergamo. AMD EPYC 97X4-processorerna ger större vCPU-densitet och ökad prestanda inriktad på AI-applikationer och applikationer som körs i molnet.

AMD Bergamo

AMD EPYC Zen 4-processorerna, utrustade med 3D V-Cache, kodnamnet Genoa-X, identifierades som den ledande x86-serverprocessorn för teknisk beräkning i en nyligen genomförd SPEC.org Rapportera. Dessa processorer ger 3D V-Cache till de 96-kärniga Zen 4-kretsarna och är idealiska för krävande tekniska datorarbeten.

Enligt AMD kan en anpassning av sin produktfärdplan till kundernas miljöer leverera den prestanda som behövs för allmänna, molnbaserade och tekniska arbetsbelastningar. AMD har tagit ståndpunkten att en storlek inte passar alla. Dessa nya AMD EPYC-processorer designades kring det konceptet för att leverera ökad prestanda för specifika arbetsbelastningar.

Applikationer är alltmer designade för molnbaserade arbetsbelastningar, vilket möjliggör snabb utveckling, distribution och uppdateringar. AMD EPYC 97X4-processorerna, med 128 kärnor, kan leverera bättre genomströmning, upp till 3.7 gånger bättre prestanda för viktiga molnbaserade arbetsbelastningar jämfört med Ampere.

Modell Kärnor Max trådar Standard TDP (W) Basfrekvens (GHz) Boost Freq1 (GHz) L3-cache (MB)
9754 128 256 360W 2.25 3.10 256
9754S 128 128 360W 2.25 3.10 256
9734 112 224 320W 2.20 3.00 256

De 4:e generationens AMD EPYC-processorer med 3D V-Cache tillgodoser behovet av snabbare designiterationer och omfattande simuleringar och levererar en klassens bästa x86-processor för tekniska beräkningsbelastningar som beräkningsvätskedynamik (CFD), finita elementanalys (FEA) , elektronisk designautomation (EDA) och strukturanalys. Dessa processorer har upp till 96 "Zen 4"-kärnor och 1 GB+ L3-cache och kan avsevärt påskynda produktutvecklingen.

Modell Kärnor Max trådar Standard TDP (W) Basfrekvens (GHz) Boost Freq1 (GHz) L3-cache (MB)
9684X 96 192 400W 2.55 3.70 1,152
9384X 32 64 320W 3.10 3.90 768
9184X 16 32 320W 3.55 4.20 768

AMD Bergamo och Genoa-X Benchmarks

Vi testade två nya processorer och simulerade en tredje genom att inaktivera SMT. I labbet hade vi 9754, ett Bergamo-chip med 128 kärnor och 256 trådar, och 9684X, ett Genoa-X-chip med 96 kärnor och 192 trådar med en massiv 1.1 GB 3D L3-cache och en högre klocka än Genoa. För att simulera den tredje inaktiverade vi SMT på vår 9754 eftersom AMD även har släppt 9754S Bergamo-chippet, som kommer utan multithreading och bara är rena kärnor. Vår testning av det SMT-inaktiverade chippet kommer att vara separat från denna recension.

Vi genomförde en omfattande uppsättning benchmarks för att utvärdera prestandan hos de nyligen släppta AMD Bergamo och Genoa-X CPU:erna. Vi började med Cinebench R23-tester på fler- och enkelkärniga konfigurationer, vilket gav värdefulla insikter om dessa processorers renderingsförmåga.

Det verkar som att applikationen, Cinebench R23, i sig är begränsad i hur den kan hantera så många trådar. Vi noterade ett tak på 128 kärnor, men 96 Core Genoa-X 3D Cache lyser verkligen i sin prestanda, teman som kommer att vara gemensamma i alla tester.

Därefter körde vi y-cruncher på 1 miljard och 10 miljarder siffrorsnivåer för att bedöma deras beräkningsförmåga, särskilt för uppgifter som involverar en hög grad av siffror.

Lägre är bättre här, våra 2-processorer och 96 kärnor i Genoa-resultaten är efter en del omfattande justeringar och kunde sätta upp några bra siffror, och lagerkonfigurationen av både Genoa-X och Bergamo-chippen visar en lovande potential för justering och justeringar. upp några ännu mer imponerande rekordsiffror.

Vi använde sedan Blender-riktmärken, särskilt Monster-, Junkshop- och Classroom-testerna, för att mäta hur väl dessa CPU:er presterar i grafiskt intensiva renderingsscenarier.

I Blender benchmark visade den råa kraften av 512 trådar verkligen igenom, återigen toppade listorna med bara en aktiekonfiguration.

Slutligen körde vi Geekbench 6 CPU-tester, kända för sin breda undersökning av processorprestanda i enkelkärniga och multikärniga operationer. Den här testsviten gav oss en heltäckande bild av de övergripande kapaciteterna, styrkorna och de stegvisa förbättringarna hos AMD Bergamo- och Genoa-X-processorerna.

Prestandaöversikt

Här är råpoängen för vart och ett av riktmärkena. Kom ihåg att vi hade månader på oss att göra trimning och konfigurering på det 96-kärniga Genoa-systemet, och körde bara en lagerkonfiguration av nya AMD Bergamo.

riktmärke 2p/96c Genua 1p/96c Genoa-X 1p/128c Bergamo 2p/128c Bergamo
Cinebench R23 Multi 116744 93720 103876 102125
Cinebench R23 Single 1294 1301 1098 1089
Cinebench MP-förhållande 90.22 72.04 94.65 93.75
y-cruncher 1b 8.882 10.296 9.568 9.184
y-cruncher 10b 51.071 72.377 80.171 55.683
Blendermonster 1700.647985 879.580323 1031.49474 2038.714424
Blender Junkshop 1101.839271 605.445705 704.167826 1382.575225
Blenderklassrum 869.476693 421.318478 506.665693 1045.959162
Geekbench 6 CPU singel 2048 2093 1738 1723
Geekbench 6 CPU Multi 20217 21329 18683 17916

AMD Bergamo för AI

Med en rad AI-inferensmotorer från toppleverantörer UL Procyon AI Inference Benchmark tillgodoser ett brett spektrum av hårdvaruinställningar och krav. Benchmark-poängen ger en bekväm och standardiserad sammanfattning av slutledningsprestanda på enheten. Detta gör det möjligt för oss att jämföra och kontrastera olika hårdvaruinställningar i verkliga situationer utan att kräva interna lösningar.

Processorn Modell Genomsnittlig slutledningstid Median slutledningstid Totalt antal slutsatser
2p/96c Genua MobileNet V3 3.61 ms 3.63 ms 45,800
1p/96c Genoa-X MobileNet V3 2.71 ms 2.72 ms 58,631
1p/128c Bergamo MobileNet V3 3.90 ms 3.91 ms 41,538
2p/128c Bergamo MobileNet V3 4.10 ms 4.16 ms 40,008
2p/96c Genua ResNet 50 6.36 ms 6.34 ms 26,525
1p/96c Genoa-X ResNet 50 6.66 ms 6.64 ms 25,049
1p/128c Bergamo ResNet 50 10.14 ms 10.08 ms 16,919
2p/128c Bergamo ResNet 50 8.21 ms 8.22 ms 20,842
2p/96c Genua Inception V4 25.98 ms 25.99 ms 6,555
1p/96c Genoa-X Inception V4 29.19 ms 29.18 ms 5,879
1p/128c Bergamo Inception V4 33.17 ms 33.04 ms 5,158
2p/128c Bergamo Inception V4 30.63 ms 30.68 ms 5,573
2p/96c Genua DeepLab V3 25.51 ms 25.33 ms 5,660
1p/96c Genoa-X DeepLab V3 28.26 ms 27.86 ms 5,394
1p/128c Bergamo DeepLab V3 32.16 ms 32.09 ms 4,708
2p/128c Bergamo DeepLab V3 31.16 ms 30.57 ms 4,807
2p/96c Genua YOLO V3 34.10 ms 34.13 ms 4,818
1p/96c Genoa-X YOLO V3 43.59 ms 43.58 ms 3,831
1p/128c Bergamo YOLO V3 44.50 ms 44.39 ms 3,739
2p/128c Bergamo YOLO V3 41.35 ms 41.38 ms 4,001
2p/96c Genua Real-ESRGAN 2540.04 ms 2524.03 ms 71
1p/96c Genoa-X Real-ESRGAN 3725.07 ms 3720.35 ms 49
1p/128c Bergamo Real-ESRGAN 2734.77 ms 2717.41 ms 66
2p/128c Bergamo Real-ESRGAN 2291.66 ms 2301.35 ms 79

Avslutande tankar

Våra tester med den nya 128-kärniga AMD Bergamo-processorn återspeglar de förväntade ökningarna av uppgången i kärnantalet. När det gäller rå prestanda, hanterade den nya CPU:n data och beräkningsintensiva uppgifter med en lätthet som verkade nästan enkel. Våra försök med 3D-rendering och beräkningsapplikationer, i synnerhet, visade upp den verkliga skickligheten hos dessa extra kärnor.

Vi noterade en betydande ökning av bearbetningshastigheter jämfört med Genoa med 96 kärnor, både med och utan SMT aktiverat, vilket lyfter fram effektiviteten i AMD:s chipletdesign. När vi gräver djupare in i eran av avancerad datoranvändning med ultrahögt kärnantal, sätter detta monster med 128 kärnor och 256 trådar ett nytt riktmärke för rackdensitet.

Engagera dig med StorageReview

Nyhetsbrev | Youtube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Rssflöde