Intel har lanserat sin fjärde generationens Intel Xeon skalbara processorer (Sapphire Rapids), Intel Xeon CPU Max Series (Sapphire Rapids HBM) och Intel Data Center GPU Max Series (Ponte Vecchio). De är specialbyggda för att förbättra datacenterprestanda, effektivitet, säkerhet och kapacitet för AI, molnberäkning, nätverk, edge computing och superdatorer. Intel samarbetar med kunder för att erbjuda skräddarsydda lösningar och system som använder de nya produkterna för att möta datorbehov i stor skala.
Intel har lanserat sin fjärde generationens Intel Xeon skalbara processorer (Sapphire Rapids), Intel Xeon CPU Max Series (Sapphire Rapids HBM) och Intel Data Center GPU Max Series (Ponte Vecchio). De är specialbyggda för att förbättra datacenterprestanda, effektivitet, säkerhet och kapacitet för AI, molnberäkning, nätverk, edge computing och superdatorer. Intel samarbetar med kunder för att erbjuda skräddarsydda lösningar och system som använder de nya produkterna för att möta datorbehov i stor skala.
Det finns för närvarande över 100 miljoner individuella Xeon-processorer i bruk världen över. Varför är de så populära? Tja, de finns i olika konfigurationer och är designade för att vara skalbara, vilket gör att de kan användas i en mängd olika applikationer och miljöer. De kan också anpassas för specifika arbetsbelastningar eller applikationer, erbjuder en rad säkerhetsfunktioner för att skydda mot hot som skadlig programvara och dataintrång, och är mycket energieffektiva.
4:e generationens Intel Xeon skalbara CPU-modeller
De nya Xeon-modellerna finns i sex kategorier, inklusive Max 9400, Platinum 8000, Gold 6000, Gold 5000, Silver 4000 och Bronze 3000, samt Max-serien. Varje serie har en rad olika modeller som kan borras ner till deras målanvändningsfall:
- Prestanda allmänt syfte
- Mainline allmänt syfte
- Vätskekylning för allmänt ändamål
- Enkel uttag för allmänt bruk (”Q”-serien)
- Long-life Use (IoT) för allmänt bruk ("T"-serien)
- IMDB/Analytics/virtualiseringsoptimerad ("H"-serien)
- 5G/nätverksoptimerad ("N"-serien)
- Molnoptimerad IaaS ("P", "V" och "M"-serien)
- Lagrings- och hyperkonvergerad infrastruktur optimerad ("S"-serien)
- HPC-optimerad (dvs Intel Xeon CPU Max-serien)
Till exempel den kraftfulla Platina 8400 Processorer är designade för avancerad dataanalys, AI och hybridmolndatacenter, och erbjuder hög prestanda, plattformskapacitet och acceleration av arbetsbelastning, samt förbättrad hårdvarubaserad säkerhet och multi-socket-bearbetning. Dessa processorer erbjuder också upp till 60 kärnor per processor (en ökning med 20 kärnor jämfört med toppen 3:e generationens Xeon-modell), åtta minneskanaler och AI-acceleration med Intel AMX.
Intel Xeon Gold 6400 och Guld 5400 processorer är optimerade för arbetsbelastningar i datacenter och flera moln. De erbjuder förbättrad minneshastighet, kapacitet, säkerhet och acceleration av arbetsbelastningen. Intel Xeon Silver 4400 processorer ger grundläggande prestanda, förbättrad minneshastighet och energieffektivitet för datacenterdatorer, nätverk och lagring på nybörjarnivå.
Här är en detaljerad genomgång av varje Xeon-processor och dess målinriktade användningsfall:
Egenskaper | Fjärde generationens Intel Xeon skalbara processorer | Intel Xeon CPU Max-serien | |
Extremt kärnantal (XCC) | Medium Core Count (MCC) | High Bandwidth Memory (HBM) | |
Die Konstruktion |
Fyra brickor anslutna med MDF över Intel Embedded Multi-die Interconnect Bridge (EMIB) |
Ett monolitiskt chip |
Fyra brickor anslutna med MDF över Intel Embedded Multi-die Interconnect Bridge (EMIB) |
Core Count | Upp till 60 aktiva kärnor | Upp till 32 aktiva kärnor | Upp till 56 aktiva kärnor |
TDP-intervall | 225 till 350W | 125 till 350W | 350W |
Minne |
DDR5 @ 4800 (1 DPC), 4400 (2DPC), 16 Gb DRAM, 8 kanaler
Intel Optane PMem 300 (Crow Pass) @4400 MT/s |
DDR5 @ 4800 (1 DPC), 4400 (2DPC), 8 kanaler
64 GB HBM2e-minne med upp till 1.14 GB/kärna |
|
Intel UPI | UPI 2.0 @ 16 GT/s, upp till 4 Ultra Path Interconnects | UPI 2.0 @ 16 GT/s, upp till 3 Ultra Path Interconnects | UPI 2.0 @ 16 GT/s, upp till 4 Ultra Path Interconnects |
Skalbarhet | 1 uttag, 2 uttag, 4 uttag, 8 uttag | 1 uttag, 2 uttag, 4 uttag | 1 uttag, 2 uttag |
PCIe/Compute Express Link | PCIe 5.0 (80 banor),
Upp till 4 enheter stöds via Compute Express Link (CXL) 1.1 |
||
Säkerhet | intel sgx
Minsta EPC-storlek (Enclave Page Cache) 256 MB |
Intel SGX (endast platt läge) | |
Integrerade IP-acceleratorer | Intel QAT, DLB, IAA, DSA (upp till 4 enheter vardera) | Intel QAT, DLB (upp till 2 enheter vardera), Intel DSA, IAA (1 enhet vardera) | Intel DSA (4 enheter) |
Den fjärde generationens Intel Xeon Scalable-processorer syftar till att förbättra prestanda och tackla olika datorutmaningar relaterade till AI, analys, nätverk, säkerhet, lagring och högpresterande datoranvändning (HPC). Dessa processorer är anmärkningsvärda för att ha de mest inbyggda acceleratorerna av alla processorer.
Enligt Intel kan 4:e generationens Intel Xeon Scalable-kunder förvänta sig en genomsnittlig prestandaförbättring inom följande:
- 9x förbättringen av effektiviteten per watt vid användning av inbyggda acceleratorer,
- 70-watts energibesparing per CPU i optimerat energiläge med minimal prestandaförlust,
- Femtiofem procents minskning av den totala ägandekostnaden och strömförbrukningen jämfört med tidigare generationer.
Fjärde generationens Intel Xeon Scalable – Förbättrad strömeffektivitet
Det nya optimerade strömläget kan ge upp till 20 procents strömbesparingar i uttaget med mindre än 5 procents prestandapåverkan för specifika arbetsbelastningar. Innovationer inom luft- och vätskekylning kan ytterligare minska den totala energiförbrukningen för datacenter.
4:e generationens Intel Xeon Scalable CPU: er är utrustade med ett stort antal inbyggda acceleratorer, vilket kan hjälpa till att spara ström på plattformsnivå och minska behovet av ytterligare acceleration. Detta kan hjälpa deras kunder att nå sina hållbarhetsmål. Dessutom förväntas det nyligen introducerade Optimized Power Mode ge upp till 20 procent strömbesparingar i uttaget med minimal påverkan på prestanda för specifika arbetsbelastningar.
Innovationer inom luft- och vätskekylning kan ytterligare minska den totala energiförbrukningen för datacenter. Den fjärde generationens Xeon-processorer har också tillverkats med 4 procent eller mer förnybar el på Intels anläggningar med avancerade vattenåtervinningsanläggningar.
Nya framsteg inom AI-prestanda
Jämfört med föregående generation är 4:e generationens Xeon-processorer citerade för att uppnå upp till 10 gånger högre PyTorch-inferens- och träningsprestanda i realtid med hjälp av deras Advanced Matrix Extension (Intel AMX) acceleratorer,
PyTorch är ett ramverk för maskininlärning för att bygga och träna neurala nätverk. Realtidsinferens innebär att man använder en tränad neural nätverksmodell för att göra realtidsförutsägelser eller beslut baserat på ny indata. Högre PyTorch-inferens- och träningsprestanda i realtid är avgörande för Intel-processorer eftersom det tillåter dem att köra maskininlärningsarbetsbelastningar som involverar realtidsförutsägelse eller beslutsfattande mer effektivt.
Detta är särskilt användbart i applikationer där snabba och exakta förutsägelser eller beslut är av största vikt. Dessutom kan högre prestanda i maskininlärningsuppgifter leda till snabbare träning av modeller och mer exakta förutsägelser, samt möjligheten att använda större och mer komplexa modeller.
Som sådan säger Intel att deras nya 4:e generationens Intel Xeon Scalable-processorer kan ge ännu fler funktioner för naturlig språkbehandling, vilket gör anspråk på upp till 20 gånger snabbare på stora språkmodeller.
Intels AI-programsvit, testad med över 400 maskininlärnings- och djupinlärnings-AI-modeller inom olika branscher och applikationer, kan användas med utvecklarens föredragna AI-verktyg för att öka produktiviteten och påskynda AI-utvecklingen. Sviten är designad för att vara portabel, så att den kan användas på arbetsstationen och distribueras i kanten och i molnet.
Nätverkskapacitet
4:e generationens Intel Xeon Scalable-processorer erbjuder också specifikt optimerade modeller för högpresterande nätverk med låg latens och edge-arbetsbelastningar. Dessa processorer spelar en avgörande roll för att driva en mer mjukvarudefinierad framtid för industrier som telekommunikation, detaljhandel, tillverkning och smarta städer. För 5G kärnarbetsbelastningar kan de inbyggda acceleratorerna hjälpa till att öka genomströmningen och minska latensen, medan förbättringar av energihanteringen förbättrar plattformens lyhördhet och effektivitet.
De kan också fördubbla kapaciteten för det virtuella radioaccessnätverket (vRAN) jämfört med 3rd-gen Xeon-processorer (utan att förbruka mer ström). Generellt sett kan processorer med en högre vRAN-kapacitet mer effektivt och effektivt hantera nätverksdatatrafik, såsom att minska latens och förbättra den övergripande prestandan. Detta är särskilt viktigt för applikationer som kräver kommunikation i realtid.
Intel indikerar att detta kommer att göra det möjligt för leverantörer av kommunikationstjänster att fördubbla sin prestanda per watt och möta sina prestanda- och energieffektivitetsbehov. Ökningen av vRAN skulle också göra det möjligt för organisationer att skala upp eller ner lättare när antalet vRAN-arbetsbelastningar ändras, vilket innebär större flexibilitet i nätverksresurser (t.ex. utan att kräva ytterligare hårdvara, kraft eller infrastruktur).
HPC
Beräkningsblad (öppet chassi) vid Intel HPC-labb
4:e generationens Intel Xeon Scalable och Intel Max Series-produkterna erbjuder en skalbar, balanserad arkitektur som kombinerar CPU och GPU med oneAPI:s öppna mjukvaruekosystem för krävande datorbelastningar i HPC och AI. Intel hävdar att den här arkitekturen är speciellt utformad för att tackla världens svåraste problem idag.
OneAPI open software är en uppsättning verktyg och bibliotek som gör det möjligt för utvecklare att skriva kod som kan köras på olika hårdvaruplattformar (inklusive CPU:er, GPU:er och andra specialiserade processorer) med en enda uppsättning programmeringsgränssnitt. Detta kan göra det lättare att utveckla och optimera applikationer för olika datormiljöer.
Beräkningsblad på Intel HPC-labb
På Intels Jones Farm fick StorageReview en titt bakom kulisserna på Borealis. Intel, HPE och Argonne National Laboratory arbetar för att leverera superdatorn Aurora, som kommer att implementeras med den nya 4:e generationens Xeon, och Datacenter GPU-plattformar som tillkännages idag.
Borealis är ett minisystem med två rack beläget på Jones Farm-labbet i Oregon som validerar Aurora-systemet och dess nya teknologier. Den har samma arkitektur och design som Aurora och testas för att validera alla komponenter i mjukvaran och vätskekylsystemen innan systemet installeras i stor skala på Argonne National Laboratory.
Vattenkylningssystem: Labbchef på Jones Farm HPC Lab – Borealis visar upp de röda och blå rören som är en del av vattenkylningssystemet för att hålla racken svala.
Intel Xeon CPU/GPU Max-serien
Intel Xeon CPU Max Series är den första x86-processorn med minne med hög bandbredd som kommit ut på marknaden, vilket gör att den kan accelerera många HPC-arbetsbelastningar utan att behöva ändra kod. Företaget kallar Intel Data Center GPU Max-serien som sin processor med högsta densitet, som kommer att finnas tillgänglig i olika formfaktorer för att passa en rad kunders behov.
Xeon CPU Max-serien erbjuder 64 GB minne med hög bandbredd på paketet, vilket avsevärt ökar datagenomströmningen för HPC- och AI-arbetsbelastningar. Jämfört med toppklassiga 3:e generationens Intel Xeon-skalbara processorer, ger Xeon CPU Max-serien upp till 3.7 gånger mer prestanda på olika verkliga tillämpningar som energi- och jordsystemsmodellering. CPU-bandbredd är avgörande för HPC- och AI-arbetsbelastningar, eftersom de ofta kräver en stor mängd data som ska bearbetas och flyttas mellan CPU:n och minnet. Annars kan det flaskhalsar systemets prestanda och leda till längre handläggningstider.
Data Center GPU Max-serien, som har över 100 miljarder transistorer i ett paket med 47 brickor, ger ökad genomströmning till arbetsbelastningar som involverar fysik, finansiella tjänster och biovetenskap. I kombination med Xeon CPU Max-serien kan plattformen uppnå upp till 12.8 gånger högre prestanda än föregående generation när man kör molekylär dynamiksimulatorn LAMMPS (Large-scale Atomic/Molecular Massively Parallel Simulator).
Intel lanserade Datacenter GPU Flex-serien tillbaka i augusti 2022, ett Xe HPG-baserat kort som har upp till 16 (8 per GPU) X-kärnor, 16 TFLOPS och 16 GB minneskapacitet.
Intel On-Demand
Intel On-Demand är en tjänst som tillåter kunder att utöka eller uppgradera acceleratorerna och de hårdvaruförbättrade funktionerna som finns tillgängliga på de flesta 4:e generationens Intel Xeon Scalable-processorer. Tjänsten hanteras av Intel och hårdvaruleverantörer och består av ett API för licensbeställning och en mjukvaruagent för licenstillhandahållande och aktivering.
Kunder kan välja att köpa On-Demand-funktioner vid köptillfället eller som en uppgradering efter köpet, och Intel arbetar också på en mätningsmodell där funktionerna kan slås på och av efter behov, och betalningen baseras på användande. Introduktionen av aktiveringsmodellen med 4:e generationens Xeon-processorer tillåter kunder att välja fullfjädrade premium-SKU:er eller lägga till funktioner när som helst under processorns livscykel.
Initiala leverantörer av On-Demand inkluderar H3C, Inspur, Lenovo, Supermicro och Variscale, med Intel som arbetar med ytterligare leverantörer om deras aktiveringsplaner.
DRM på kretsnivå, eller hantering av digitala rättigheter, hänvisar till teknik som kontrollerar åtkomst till vissa datorchipfunktioner eller -funktioner. I samband med Intel On-Demand kan DRM på chipnivå potentiellt användas för att begränsa åtkomsten till vissa funktioner eller möjligheter hos 4:e generationens Intel Xeon Scalable-processorer om de inte köps eller aktiveras via On-Demand-tjänsten. Detta kan påverka rätten att reparera, eftersom det kan göra det svårare för individer eller oberoende reparationsverkstäder att komma åt och reparera vissa aspekter av system utrustade med Intel On-Demand.
Miljömässig hållbarhet är en viktig faktor när det kommer till användning och kassering av tekniska produkter, inklusive företagsprocessorer. Även om Intel On-Demand kan tillåta kunder att utöka eller uppgradera kapaciteten hos sina processorer, är det oklart hur denna tjänst kan påverka produkternas miljömässiga hållbarhet. Eftersom TDP för paketet inte ändras med aktivering, kan energiförbrukningen för de oanvända funktionerna och potentialen för ökat elektroniskt avfall på grund av uppgraderingar eller byten behöva beaktas. Det är avgörande för företag som Intel att överväga miljöpåverkan av sina produkter och tjänster och att arbeta mot mer hållbara lösningar.
Fjärde generationens Intel Xeon skalbar prestanda Testning
Fjärde generationens Intel Xeon Scalable-processors betoning på att förbättra effektiviteten lyser i några av våra tidiga benchmarking. Dessa nya processorer annonseras för att uppnå en 4-procentig (för allmän beräkning) ökning av effektiviteten jämfört med 53:e generationens Xeon-skalbara processorer genom förbättrade tillverkningsförfinningar och i målinriktade arbetsbelastningar, 3x genomsnittlig prestanda per watt effektivitetsförbättring med inbyggda acceleratorer.
Utöver dessa förbättringar är den nya generationens mellanskiktschip lika kraftfulla som senaste generationens toppmodeller, vilket gör dem till ett kostnadseffektivt alternativ för datacenteroperatörer. Dessa mellanskiktschip kan hjälpa datacenter att optimera sina kostnader och uppnå bättre total effektivitet genom att erbjuda liknande prestanda som flaggskeppsmodellerna till ett lägre pris.
Vi hade några alternativ för att testa prestandan hos Sapphire Rapids, och för att visa upp effektivitetsförbättringarna testade vi en mellanklass 4:e generationens plattform med dubbla 8454Y ($3,995 3) Xeons och jämförde den med en 8380:e generationens toppplattform med dubbla 9,400 ($4 XNUMX) processorer. Med nya förbättringar av XNUMX:e generationen kunde vårt mellanregistersystem hålla jämna steg med den tidigare generationens flaggskeppsmodell.
Cinebench | ||
2 x 4:e generationen 8452Y (2.0 GHz x 36) | 2 x 3:e generationen 8380 (2.3 GHz x 40) | |
Med flera kärnor | 60075 | 70540 |
Enda kärna | 841 | 985 |
Kärnmultiplikator | 71.40x | 71.63x |
Blender CLI Render Benchmark | ||
2 x 4:e generationen 8452Y (2.0 GHz x 36) | 2 x 3:e generationen 8380 (2.3 GHz x 40) | |
Monster | 652.526942 | 671.145395 |
Junkshop | 401.119468 | 407.141514 |
Klassrum | 308.802541 | 320.507039 |
Totalt | 1362.448951 | 1398.793948 |
I ett internt träningstest för AI-modeller noterade vi dessutom en ökning av prestanda med ungefär 5 procent, vilket mätte 95 minuter för 3:e generationens 8380 jämfört med 90 minuter för 4:e generationens 8452Y.
Sammantaget gör de effektivitetsförbättringar som erbjuds av 4:e generationens Intel Xeon Scalable-processorer dem till ett attraktivt alternativ för datacenteroperatörer som vill minska sin energiförbrukning och kostnader. General Purpose-processorerna erbjuder en enastående balans mellan prestanda och effektivitet, vilket gör dem till ett solidt val för en lång rad arbetsbelastningar. Vi är glada över att börja testa specifika acceleratorer på datacenters arbetsbelastningar, inklusive Data Storage Accelerator.
Marknadseffekter
Med 4:e generationens Intel Xeon skalbara processorer skickas äntligen till företaget, molnleverantörer har haft dessa under en tid, kampen pågår med AMD Genoa processorer i datacentret. På en hög nivå är det verkligen lätt att titta på Genuas enorma antal PCI-banor och förklara dem som segrare. Men att välja rätt CPU idag är mycket mer komplicerat än så. Det finns en känslig balans mellan kostnad, energi, prestanda och kvalifikationer med ytterligare komponenter i systemet. Åh, och låt oss inte försumma vikten av att förstå arbetsbelastningen för att anpassa den till rätt CPU.
Så idag finns det inget enkelt svar på frågan om vem som är bäst, Genoa eller Sapphire Rapids. Det kommer att ta tid att spela ut eftersom Dell, HPE, Supermicro, Lenovo och andra tar ut system på marknaden. Med antagandet av nya SSD-formfaktorer pågår just nu i servrar, stöd för Gen5-genomströmning och nya höghastighetsnätverk och acceleratoralternativ som DPU: er, spelet är på gång. Detta är dock inte en strid mellan specifikationsbladen. Det åligger företagets IT-organisation att vara så noggrann och informerad som möjligt för att säkerställa att de investerar i system som adekvat stödjer deras applikationsbehov. Och det kan vara den största utmaningen av alla. Med så många valmöjligheter kan sofistikerade IT-partners vara mer kritiska nu än någonsin.
Engagera dig med StorageReview
Nyhetsbrev | Youtube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Rssflöde