Home EnterpriseAI WEKA onthult NVIDIA-integratie en Augmented Memory Grid

WEKA onthult NVIDIA-integratie en Augmented Memory Grid

by Harold Frits

Het Augmented Memory van WEKA voor AI-inferentie verhoogt de GPU-efficiëntie, vermindert de latentie en kosten en schaalt AI-modellen voor bedrijfswerklasten.

WEKA heeft zijn strategische integratie met het NVIDIA AI Data Platform referentieontwerp aangekondigd. Het behaalde kritische NVIDIA opslagcertificeringen om geoptimaliseerde infrastructuur te bieden die expliciet is afgestemd op agentische AI ​​en complexe redeneringsmodellen. Naast deze aankondiging introduceerde WEKA zijn innovatieve Augmented Memory Grid-mogelijkheid en aanvullende NVIDIA Cloud Partner (NCP) Reference Architectures-certificeringen, waaronder NVIDIA GB200 NVL72 en NVIDIA-Certified Systems Storage voor AI-fabrieksimplementaties op ondernemingsniveau.

Versnellen van AI-agenten

Het NVIDIA AI Data Platform vertegenwoordigt een significante sprong voorwaarts in enterprise AI-infrastructuur, door de NVIDIA Blackwell-architectuur, NVIDIA BlueField DPU's, Spectrum-X-netwerken en NVIDIA AI Enterprise-software naadloos te integreren. Door deze geavanceerde NVIDIA-infrastructuur te koppelen aan het WEKA Data Platform, kunnen ondernemingen een enorm schaalbare opslagfundament implementeren dat expliciet is ontworpen voor AI-inferentiewerklasten met hoge prestaties.

Deze geïntegreerde oplossing richt zich rechtstreeks op de groeiende vraag naar enterprise AI en biedt AI-queryagenten naadloze, versnelde toegang tot kritieke business intelligence, wat resulteert in aanzienlijk verbeterde inferentieprestaties en redeneringsnauwkeurigheid. Het dataplatform van WEKA zorgt ervoor dat AI-systemen gegevens snel kunnen omzetten in bruikbare intelligentie, en ondersteunt zo de geavanceerde redenering die vereist is door AI-modellen van de volgende generatie.

WEKA Augmented Memory-raster

Agentische AI-modellen evolueren voortdurend en kunnen grotere contextvensters, uitgebreide parametertellingen en belangrijkere geheugenvereisten beheren. Deze ontwikkelingen verleggen vaak de grenzen van traditionele GPU-geheugencapaciteiten, waardoor knelpunten ontstaan ​​in AI-inferentie. WEKA pakt deze uitdagingen aan met zijn baanbrekende Augmented Memory Grid-oplossing, een innovatie die het beschikbare geheugen voor AI-workloads uitbreidt en petabyte-schaalvergrotingen biedt, ver voorbij de huidige beperkingen van één terabyte.

Augmented Memory voor AI-inferentie - Augmented Memory Grid

WEKA's Augmented Memory Grid verbetert AI-inferentie aanzienlijk door WEKA's dataplatformsoftware te combineren met NVIDIA's versnelde computer- en netwerktechnologieën. Deze combinatie maakt toegang met bijna-geheugensnelheid mogelijk met microseconde latentie, wat de tokenverwerkingsprestaties en algehele AI-inferentie-efficiëntie drastisch verbetert.

Belangrijke voordelen van WEKA's Augmented Memory Grid zijn:

  • Drastisch verminderde latentie:Bij tests met 105,000 tokens leverde het Augmented Memory Grid van WEKA een opmerkelijke verbetering van 41x in de tijd tot het eerste token, vergeleken met traditionele herberekeningsmethoden.

  • Geoptimaliseerde tokendoorvoer:De oplossing van WEKA verwerkt inferentiewerklasten efficiënt in meerdere clusters, waardoor een hogere tokendoorvoer wordt bereikt tegen lagere totale kosten. Hierdoor dalen de kosten per verwerkt token in het hele systeem tot wel 24%.

Deze prestatieverbeteringen vertalen zich direct in een grotere economische efficiëntie, waardoor ondernemingen AI-gestuurde innovatie kunnen versnellen zonder dat dit ten koste gaat van de mogelijkheden van het model of de prestaties van de infrastructuur.

WEKApod Nitro

WEKApod Nitro Data Platform-apparaten hebben meerdere NVIDIA-certificeringen gekregen, waarmee WEKA zich heeft gevestigd als toonaangevende leverancier van hoogwaardige opslag voor zakelijke AI:

  • NVIDIA Cloud Partner (NCP)-certificering: WEKApod Nitro is een van de eerste opslagoplossingen die is gecertificeerd voor NVIDIA's NCP Reference Architectures, waaronder HGX H200, B200 en GB200 NVL72. Deze apparaten geven serviceproviders en ontwikkelaars de mogelijkheid om enorme GPU-clusters te ondersteunen, tot 1,152 GPU's in een 8U-configuratie, terwijl ze een uitzonderlijke prestatiedichtheid en energie-efficiëntie behouden.

  • NVIDIA-gecertificeerde systeemopslagaanduiding: WEKApod Nitro-apparaten hebben de nieuwe enterprise storage-certificering van NVIDIA ontvangen, waarmee compatibiliteit met NVIDIA Enterprise Reference Architectures en best practices wordt gegarandeerd. Deze aanduiding valideert dat WEKA's Data Platform optimale storageprestaties, efficiëntie en schaalbaarheid levert voor veeleisende enterprise AI- en HPC-implementaties.

Nilesh Patel, WEKA's Chief Product Officer, benadrukte het transformatieve potentieel van deze samenwerking met NVIDIA. Patel vergeleek deze ontwikkeling met doorbraken in de lucht- en ruimtevaart en zei: "Net zoals het doorbreken van de geluidsbarrière nieuwe grenzen opende, verbrijzelt WEKA's Augmented Memory Grid de AI-geheugenbarrière, breidt het GPU-geheugen drastisch uit en optimaliseert de tokenefficiëntie. Deze innovatie transformeert fundamenteel de AI-tokeneconomie, waardoor snellere innovatie en lagere kosten mogelijk worden zonder dat dit ten koste gaat van de prestaties."

Rob Davis, Vice President of Storage Networking Technology bij NVIDIA, benadrukte het belang van deze integratie nog eens: "Bedrijven die agentische AI ​​en redeneringsmodellen implementeren, hebben ongekende efficiëntie en schaalbaarheid nodig. Door NVIDIA- en WEKA-technologieën te combineren, kunnen AI-agenten gegevens met ongeëvenaarde snelheid en nauwkeurigheid benaderen en verwerken tijdens inferentie."

Beschikbaarheid

  • De NCP-referentiearchitectuur van WEKA voor NVIDIA Blackwell-systemen is vanaf maart beschikbaar.
  • De WEKA Augmented Memory Grid-functionaliteit zal vanaf het voorjaar van 2025 algemeen beschikbaar zijn voor WEKA Data Platform-klanten.

Neem contact op met StorageReview

Nieuwsbrief | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed