Under en presentation på ISC 23 lyfte Intel fram sitt prestationsledarskap för högpresterande datorer (HPC) och artificiell intelligens (AI), delade med sig av sin portfölj av framtida HPC- och AI-produkter och tillkännagav ambitiösa planer för en internationell ansträngning att använda Aurora superdator för att utveckla generativa AI-modeller för vetenskap och samhälle.
Under en presentation på ISC 23 lyfte Intel fram sitt prestationsledarskap för högpresterande datorer (HPC) och artificiell intelligens (AI), delade med sig av sin portfölj av framtida HPC- och AI-produkter och tillkännagav ambitiösa planer för en internationell ansträngning att använda Aurora superdator för att utveckla generativa AI-modeller för vetenskap och samhälle.
Konkurrensprestandan toppade notan, där Intels resultat var klara vinnare mot konkurrenterna. Intels Data Center GPU Max-serie överträffade NVIDIA H100 PCIe-kort med i genomsnitt 30 procent på olika arbetsbelastningar. Oberoende resultat från programvaruleverantören Ansys indikerade en 50-procentig snabbare ökning för Max Series GPU jämfört med H100 på AI-accelererade HPC-applikationer.
Xeon Max Series CPU visade en 65-procentig förbättring jämfört med AMD:s Genoa-processor på High-Performance Conjugate Gradients (HPCG) benchmark, och den använde mindre ström. En HPC-favorit, 4:e generationens Intel Xeon Scalable Processor, levererade i genomsnitt 50 procent snabbare jämfört med AMD:s Milan4. BP:s senaste 4:e generationens Xeon HPC-kluster visade en 8x ökning i prestanda jämfört med sin tidigare generations processor med förbättrad energieffektivitet. Gaudi2 djupinlärningsacceleratorn presterade konkurrenskraftigt på djupinlärning, träning och slutledning, med upp till 2.4 gånger snabbare prestanda än NVIDIAs A100.
Nästa generations processorer och AI-optimerade grafikprocessorer
Intels Jeff McVeigh, Intels koncernchef och general manager för Super Compute Group, introducerade Intels nästa generations processorer designade för att möta höga krav på minnesbandbredd. Intel utvecklade en ny typ av DIMM–Multiplexer Combined Ranks (MCR)– för Granite Rapids. MCR uppnår hastigheter på 8,800 5 megaöverföringar per sekund baserat på DDR1.5 och mer än XNUMX terabyte/sekund (TB/s) minnesbandbreddskapacitet i ett system med två sockel.
Intel avslöjade också ett nytt, AI-optimerat x8 Max Series GPU-baserat delsystem från Supermicro, designat för att påskynda djupinlärningsträning. OEM-tillverkare förväntas erbjuda lösningar med Max Series GPU:er x4 och x8 OAM-delsystem och PCIe-kort någon gång i sommar.
Intels nästa generations Max Series GPU, Falcon Shores, kommer att ge kunderna flexibiliteten att implementera CPU på systemnivå och diskreta GPU-kombinationer för nya och ständigt föränderliga arbetsbelastningar i framtiden. Falcon Shores-systemet använder en modulär, kakelbaserad arkitektur som gör det möjligt att:
- Stöd HPC och AI datatyper från FP64 till BF16 till FP8.
- Aktivera upp till 288 GB HBM3-minne med upp till 9.8 TB/s total bandbredd och avsevärt förbättrad höghastighets-I/O.
- Styr CXL-programmeringsmodellen.
- Presentera ett enhetligt GPU-programmeringsgränssnitt genom oneAPI.
Generativ AI för vetenskap
Argonne National Laboratory, i samarbete med Intel och HPE, tillkännagav planer på att skapa en serie generativa AI-modeller för det vetenskapliga forskarsamhället. Dessa generativa AI-modeller för vetenskap kommer att tränas på allmän text, kod, vetenskapliga texter och strukturerade vetenskapliga data från biologi, kemi, materialvetenskap, fysik, medicin och andra källor.
De resulterande modellerna (med så många som 1 biljon parametrar) kommer att användas i en mängd olika vetenskapliga tillämpningar, från design av molekyler och material till syntes av kunskap över miljontals källor för att föreslå nya och spännande experiment inom systembiologi, polymerkemi och energimaterial, klimatvetenskap och kosmologi. Modellen kommer också att användas för att påskynda identifieringen av biologiska processer relaterade till cancer och andra sjukdomar och föreslå mål för läkemedelsdesign.
För att främja projektet leder Argonne ett internationellt samarbete som inkluderar:
- Intel
- HPE
- Institutionen för energilaboratorier
- amerikanska och internationella universitet
- ideella organisationer
- Internationella partners
Aurora förväntas erbjuda mer än två exaflops av maximal dubbelprecisions beräkningsprestanda när den lanseras i år.
oneAPI-fördelar med HPC-applikationer
De senaste Intel oneAPI-verktygen levererar hastigheter för HPC-applikationer med OpenMP GPU-avlastning, utökar stödet för OpenMP och Fortran och accelererar AI och djupinlärning genom optimerade ramverk, inklusive TensorFlow och PyTorch, och AI-verktyg, vilket möjliggör ökade prestandaförbättringar.
Multiarkitekturprogrammering är enklare för programmerare genom oneAPI:s SYCL-implementering, oneAPI-plugin-program för NVIDIA- och AMD-processorer utvecklade av Codeplay, och Intel DPC++ Compatibility Tool som migrerar kod från CUDA till SYCL och C++, där 90-95 procent av koden vanligtvis migreras automatiskt . Den resulterande SYCL-koden visar jämförbar prestanda med samma kod som körs på NVIDIA- och AMD-native systemspråk. Data visar att SYCL-koden för DPEcho-astrofysikapplikationen som körs på Max Series GPU överträffar samma CUDA-kod på NVIDIA H100 med 48 procent.
Engagera dig med StorageReview
Nyhetsbrev | Youtube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Rssflöde