Hem Företag En ny våg av NVIDIA HPC-innovation tillkännages

En ny våg av NVIDIA HPC-innovation tillkännages

by Harold Fritts

NVIDIA utnyttjade SC22 för att göra tillkännagivanden som lyfter fram en ny våg av HPC-innovation som möjliggör banbrytande vetenskapliga upptäckter. NVIDIA lyfte fram Quantum-2, Omniverse, HPC vid kanten och Digital Twin Simulation. Här är NVIDIA-kompileringen.

NVIDIA utnyttjade SC22 för att göra tillkännagivanden som lyfter fram en ny våg av HPC-innovation som möjliggör banbrytande vetenskapliga upptäckter. NVIDIA lyfte fram Quantum-2, Omniverse, HPC vid kanten och Digital Twin Simulation. Här är NVIDIA-kompileringen.

Först ut är tillkännagivandet att det har skett en bred användning av nästa generation H100 Tensor Core GPU:er och Quantum-2 InfiniBand, inklusive nya erbjudanden på Microsoft Azure-molnet och mer än 50 nya partnersystem för att påskynda vetenskaplig upptäckt.

NVIDIA HGX-H100

NVIDIA släppte betydande uppdateringar av sina cuQuantum-, CUDA- och BlueField DOCA-accelerationsbibliotek och tillkännagav stöd för sin Omniverse-simuleringsplattform på NVIDIA A100- och H100-drivna system. H100, Quantum-2 och biblioteksuppdateringarna är alla en del av NVIDIAs HPC-plattform. HPC-plattformen inkluderar en komplett teknikstack med CPU:er, GPU:er, DPU:er, system, nätverk och ett brett utbud av AI- och HPC-programvara som ger forskare möjligheten att effektivt accelerera sitt arbete på kraftfulla system, på plats eller i molnet.

Azure erbjuder NVIDIA Quantum-2 för HPC-arbetsbelastningar

Microsoft Azures antagande av nätverksplattformen Quantum-2 InfiniBand följde på NVIDIA Quantum-2s allmänna tillgänglighet som tillkännagavs vid GTC i mars.

Nya servrar turboladdade med H100, NVIDIA AI

ASUS, Atos, Dell, HPE, Lenovo och Supermicro är bara några av NVIDIA-partnerna som presenterar H100-drivna servrar. En femårig licens för NVIDIA AI Enterprise ingår i varje H100 PCIe GPU. Detta säkerställer att organisationer har tillgång till AI-ramverk och verktyg som behövs för att bygga H100-accelererade AI-lösningar, från medicinsk bildbehandling till vädermodeller till säkerhetsvarningssystem och mer.

Bland vågen av nya system finns Dell PowerEdge XE9680, som också tillkännagavs under SC22, som hanterar de mest krävande AI och högpresterande arbetsbelastningar. Detta är Dells första åttavägssystem baserat på NVIDIA HGX-plattformen specialbyggd för konvergens av simulering, dataanalys och AI.

PowerEdge XE8640, Dells nya HGX H100-system med fyra Hopper GPU:er, gör det möjligt för företag att utveckla, träna och distribuera AI- och maskininlärningsmodeller. XE4 är ett 8640U-racksystem som ger snabbare AI-träningsprestanda och ökade kärnfunktioner med upp till fyra PCIe Gen5-platser, NVIDIA Multi-Instance GPU (MIG)-teknik och NVIDIA GPUDirect-lagring stöd.

Stora uppdateringar av accelerationsbibliotek

För att hjälpa till att öka vetenskaplig upptäckt har NVIDIA släppt betydande uppdateringar av sina CUDA-, cuQuantum- och DOCA-accelerationsbibliotek, inklusive:

  • NVIDIA CUDA-bibliotek inkluderar nu en multi-nod, multi-GPU Eigensolver som möjliggör oöverträffad skala och prestanda för ledande HPC-applikationer som VASP, ett paket för kvantmekaniska beräkningar med första principerna.
  • NVIDIA cuQuantum mjukvaruutvecklingssats för att accelerera kvantberäkningsarbetsflöden stöder nu ungefärliga tensornätverksmetoder. Detta gör det möjligt för forskare att simulera tiotusentals qubits och möjliggör automatiskt multi-nod, multi-GPU-stöd för kvantsimulering med oöverträffad prestanda med hjälp av cuQuantum Appliance.
  • NVIDIA DOCA, det öppna moln-SDK och accelerationsramverket för NVIDIA BlueField DPU:er, inkluderar avancerad programmerbarhet, säkerhet och funktionalitet för att stödja nya användningsfall för lagring.

Dessa bibliotek gör det möjligt för forskare att skala över flera servrar och utrusta dem med prestandahöjningar för att driva vetenskapliga upptäckter. NVIDIA HPC-accelerationsbiblioteken är tillgängliga på ledande molnplattformar AWS, Google Cloud, Microsoft Azure och Oracle Cloud Infrastructure.

Omnivers öppna portaler för forskare

Därefter meddelade NVIDIA att NVIDIA Omniverse nu ansluter till ledande vetenskaplig datorvisualiseringsprogramvara och stöder nya arbetsbelastningar för batchrendering på system som drivs av NVIDIA A100 och H100 Tensor Core GPU:er.

NVIDIA introducerade också vetenskapliga och industriella digitala tvillingar i realtid för den högpresterande datorgemenskapen, möjliggjort av NVIDIA OVX, ett datorsystem designat för att driva storskaliga Omniverse digitala tvillingar, och Omniverse Cloud, en mjukvaru- och infrastruktur-som-a -tjänsteutbud.

Omniverse stöder nu batch-arbetsbelastningar som AI- och HPC-forskare, forskare och ingenjörer kan köra på sina befintliga A100- eller H100-system.

NVIDIA avslöjade också kopplingar till populära vetenskapliga datorverktyg som Kitwares ParaView, en applikation för visualisering; NVIDIA IndeX för volymetrisk rendering; NVIDIA-modul för utveckling av fysik-ML-modeller; och NeuraVDB för storskalig gles volymetrisk datarepresentation.

Genom att använda Omniverse- och hybridmoln-arbetsbelastningar kan vetenskapliga datorkunder ansluta äldre simulerings- och visualiseringspipelines för att uppnå distribuerad, helt interaktiv, sann interaktion i realtid med sina modeller och datauppsättningar. NVIDIA-kunder som Argonne National Laboratory, Lockheed Martin och Princeton Plasma Physics Laboratory ser redan fördelarna med Omniverse för HPC-arbetsbelastningar.

Omniverse får stöd från Global Scientific Leaders.

Argonne National Laboratory använder NVIDIA Omniverse på sin A100-drivna Polaris superdator för att ansluta sina äldre visualiseringsverktyg som ett första steg för att utveckla grunden för framtida digitala tvillingar.

Princeton Plasma Physics Laboratory (PPPL), det amerikanska energidepartementets nationella laboratorium för plasmafysik och fusionsvetenskap, använder Omniverse för att ansluta och accelerera toppmoderna, syntetiska HPC-simulatorer i realtid för att modellera fusionsenheter och styra system och i slutändan förbättra driften av experimentet mot en ny kommersiellt gångbar ren energikälla.

I linje med NVIDIAs Earth-2-initiativ för att påskynda klimatforskningen började flygledaren Lockheed Martin nyligen använda NVIDIA Omniverse för att förse US National Oceanic and Atmospheric Administration (NOAA) med bättre global miljö- och situationsmedvetenhet och för att utveckla en interaktiv klimatforskningspipeline.

Tillgänglighet

Dessa nya funktioner stöds nu i NVIDIA Omniverse och är tillgängliga för utvecklare och företag.

NVIDIA-plattformen löser HPC-problem vid kanten

Universitet och företag som delar arbete över långa avstånd kräver ett gemensamt språk och en säker pipeline för att få alla enheter, från mikroskop och sensorer till servrar och campusnätverk, att se och förstå överförd data. Den ökande mängden data som behöver lagras, överföras och analyseras förvärrar bara utmaningen.

NVIDIA tar itu med problemet genom att introducera en högpresterande datorplattform som kombinerar edge computing och AI för att fånga och konsolidera strömmande data från vetenskapliga edge-instrument som gör att enheterna kan prata med varandra över långa avstånd.

Plattformen består av tre huvudkomponenter, NVIDIA Holoscan, MetroX-3 och NVIDIA BlueField-3 DPU:er. NVIDIA Holoscan är ett mjukvaruutvecklingskit som datavetare och domänexperter kan använda för att bygga GPU-accelererade pipelines för sensorer som streamar data. MetroX-3 är ett nytt långdistanssystem som utökar anslutningsmöjligheterna för NVIDIA Quantum-2 InfiniBand-plattformen. Och NVIDIA BlueField-3 DPU:er ger säker och intelligent datamigrering.

Forskare kan använda den nya NVIDIA-plattformen för HPC edge computing för att säkert kommunicera och samarbeta för att lösa problem och föra samman sina olika enheter och algoritmer för att fungera som en stor superdator.

Holoscan for HPC at the Edge

Accelererat av GPU-datorplattformar som inkluderar NVIDIA IGX, HGX och DGX-system, levererar NVIDIA Holoscan den extrema prestanda som krävs för att bearbeta massiva dataströmmar som genereras av världens vetenskapliga instrument.

NVIDIA Holoscan för HPC inkluderar nya API:er för C++ och Python som HPC-forskare kan använda för att bygga sensordatabearbetningsarbetsflöden som är tillräckligt flexibla för icke-bildformat och tillräckligt skalbara för att översätta rådata till realtidsinsikter.

Holoscan hanterar också minnesallokering för att säkerställa datautbyte utan kopior, så att utvecklare kan fokusera på arbetsflödeslogiken och inte oroa sig för att hantera fil- och minnes-I/O.

De nya funktionerna i Holoscan kommer att vara tillgängliga för alla HPC-utvecklare nästa månad.

MetroX-3 går långt

Långdistanssystemet NVIDIA MetroX-3, tillgängligt nästa månad, utökar de senaste molnbaserade funktionerna hos NVIDIA Quantum-2 InfiniBand-plattformen från kanten till HPC-datacenterkärnan. Det gör det möjligt för GPU:er mellan webbplatser att säkert dela data över InfiniBand-nätverket upp till 25 miles (40 km) bort.

Genom att dra fördel av inbyggd fjärråtkomst till direkt minne kan användare enkelt migrera data och beräkningsjobb från ett InfiniBand-anslutet minikluster till huvuddatacentret eller kombinera geografiskt spridda datorkluster för högre övergripande prestanda och skalbarhet.

Datacenteroperatörer kan tillhandahålla, övervaka och driva över alla InfiniBand-anslutna datacenternätverk genom att använda NVIDIA Unified Fabric Manager för att hantera sina MetroX-3-system.

BlueField för säker, effektiv HPC

NVIDIA BlueField DPU:er avlastar, accelererar och isolerar avancerade nätverks-, lagrings- och säkerhetstjänster för att öka prestanda och effektivitet för moderna HPC.

NVIDIA ger digital tvillingsimulering till HPC-datacenteroperatörer

Simulering och digitala tvillingar kan hjälpa datacenterdesigners, byggare och operatörer att skapa mycket effektiva och prestandafulla faciliteter. NVIDIA Omniverse-simuleringsplattformen hjälper till genom att effektivisera processen för samverkande virtuell design.

Omniverse låter nu datacenteroperatörer samla in realtidsdata från deras kärnanvändning från tredje parts datorstödda design-, simulerings- och övervakningsapplikationer så att de kan se och arbeta med sina kompletta datamängder i realtid.

SC22 Omniverse-demon visar hur Omniverse tillåter användare att utnyttja kraften i accelererad beräkning, simulering och operativa digitala tvillingar kopplade till realtidsövervakning och AI. Detta gör det möjligt för team att effektivisera design av anläggningar, påskynda konstruktion och driftsättning och optimera den pågående verksamheten.

Demon lyfte också fram NVIDIA Air, en datacentersimuleringsplattform designad för att fungera med Omniverse för att simulera nätverket. Med NVIDIA Air kan team modellera hela nätverksstacken, så att de kan automatisera och validera nätverkshårdvara och mjukvara innan de tas upp.

Skapa digitala tvillingar för att lyfta design och simulering

Vid planering och konstruktion av en av NVIDIAs senaste AI-superdatorer samlades flera tekniska CAD-datauppsättningar in från industriverktyg från tredje part som Autodesk Revit, PTC Creo och Trimble SketchUp. Detta gjorde det möjligt för designers och ingenjörer att se den universella scenbeskrivningsbaserade modellen i full trohet, och de kunde samarbeta om designen i realtid.

PATCH MANAGER är ett företagsprogram för planering av kablage, tillgångar och fysiska lager punkt-till-punkt-anslutning i nätverksdomäner. Med PATCH MANAGER ansluten till Omniverse kan den komplexa topologin med port-till-port-anslutningar, rack- och nodlayouter och kablar integreras direkt i livemodellen. Detta gör det möjligt för datacenteringenjörer att se hela modellen och dess beroenden.

För att förutsäga luftflöde och värmeöverföringar använde ingenjörer Cadence 6SigmaDCX, en programvara för beräkningsvätskedynamik. Ingenjörer kan också använda AI-surrogat utbildade med NVIDIA Modulus för "vad-om"-analys i nästan realtid. Detta låter team simulera förändringar i komplex termik och kylning, och de kan se resultaten direkt.

Och med NVIDIA Air kan den exakta nätverkstopologin – inklusive protokoll, övervakning och automatisering – simuleras och förvalideras.

När ett datacenter väl har byggts kan dess sensorer, kontrollsystem och telemetri kopplas till den digitala tvillingen inuti Omniverse, vilket möjliggör realtidsövervakning av verksamheten.

Ingenjörer kan simulera vanliga faror som effekttopp eller kylsystemfel med en perfekt synkroniserad digital tvilling. Operatörer kan dra nytta av AI-rekommenderade förändringar som optimerar för nyckelprioriteringar som att öka energieffektiviteten och minska koldioxidavtrycket. Den digitala tvillingen låter dem också testa och validera mjukvaru- och komponentuppgraderingar innan de distribueras till det fysiska datacentret.

Engagera dig med StorageReview

Nyhetsbrev | Youtube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Rssflöde