NVIDIA und Google Cloud arbeiten zusammen, um Unternehmen mithilfe von Google Gemini-KI-Modellen über die Plattformen Blackwell HGX und DGX agentenbasierte KI zur Verfügung zu stellen.
NVIDIA hat eine strategische Partnerschaft mit Google Cloud angekündigt, um Unternehmen mit agentenbasierter KI vertraut zu machen. Diese Zusammenarbeit ermöglicht es Unternehmen, die KI-Modelle der Google Gemini-Familie lokal über NVIDIAs Blackwell HGX- und DGX-Plattformen sowie NVIDIA Confidential Computing für verbesserte Datensicherheit zu nutzen.
Compliance und Sicherheit mit NVIDIA Blackwell ermöglichen
Die NVIDIA Blackwell-Plattform, integriert in die Google Distributed Cloud, ermöglicht lokalen Rechenzentren die Einhaltung gesetzlicher Vorschriften und Gesetze zur Datenhoheit. Unternehmen können die Einhaltung von Vorschriften sicherstellen und gleichzeitig die Betriebseffizienz aufrechterhalten, indem sie den Zugriff auf vertrauliche Informationen wie Patientenakten, Finanztransaktionen und vertrauliche Behördendaten einschränken. Darüber hinaus schützt NVIDIA Confidential Computing vertraulichen Code innerhalb der Gemini-Modelle vor unbefugtem Zugriff und potenziellen Datenschutzverletzungen.
Sachin Gupta, Vice President und General Manager für Infrastruktur und Lösungen bei Google Cloud, betonte, dass die Partnerschaft es Unternehmen ermöglicht, das volle Potenzial der agentenbasierten KI sicher auszuschöpfen, indem sie die Leistung und vertraulichen Computerfunktionen von NVIDIA Blackwell mit betrieblicher Einfachheit kombiniert.
Zweischichtige Sicherheit
Confidential Computing mit NVIDIA Blackwell bietet Unternehmen die technische Sicherheit, dass Benutzereingaben an die Anwendungsprogrammierschnittstelle (API) der Gemini-Modelle und die zur Feinabstimmung verwendeten Daten sicher bleiben. Diese zweischichtige Sicherheit schützt vor unbefugtem Zugriff oder Manipulation und ermöglicht Unternehmen, mit Gemini-Modellen sicher Innovationen zu entwickeln und gleichzeitig den Datenschutz zu wahren.
Das On-Premises-Dilemma
Trotz der Fortschritte im multimodalen Denken – der Integration von Text, Bildern, Code und anderen Datentypen zur Lösung komplexer Probleme – stehen Unternehmen mit strengen Sicherheits- oder Datenhoheitsanforderungen bei der Einführung dieser Technologien vor Herausforderungen. Diese Partnerschaft begegnet diesen Herausforderungen, indem sie Google Cloud zu einem der ersten Anbieter macht, der vertrauliche Computing-Funktionen zur Sicherung agentenbasierter KI-Workloads in allen Umgebungen anbietet, egal ob cloudbasiert oder hybrid.
Basierend auf der NVIDIA HGX B200-Plattform mit Blackwell-Grafikprozessoren und NVIDIA Confidential Computing ermöglicht diese Lösung Kunden den Schutz ihrer KI-Modelle und -Daten und erzielt gleichzeitig bahnbrechende Leistung und Energieeffizienz. Unternehmen können nun Datensicherheit und Modellintegrität gewährleisten, ohne Kompromisse bei der Innovation einzugehen.
KI-Beobachtbarkeit und Sicherheit für agentenbasierte KI
Die Skalierung agentenbasierter KI in der Produktion erfordert robuste Beobachtbarkeit und Sicherheit, um zuverlässige Leistung und Compliance zu gewährleisten. Um dies zu erreichen, hat Google Cloud das GKE Inference Gateway eingeführt, das die Bereitstellung von KI-Inferenz-Workloads durch erweitertes Routing und Skalierbarkeit optimiert. Durch die Integration mit NVIDIA Triton Inference Server und NVIDIA NeMo Guardrails bietet das Gateway intelligentes Lastenausgleich, das die Leistung verbessert und die Bereitstellungskosten senkt. Darüber hinaus ermöglicht es zentralisierte Modellsicherheit und -verwaltung.
Google Cloud plant künftig, die Beobachtbarkeit von agentenbasierten KI-Workloads durch die Integration von NVIDIA Dynamo zu verbessern. NVIDIA Dynamo ist eine Open-Source-Bibliothek, die für die Bereitstellung und Skalierung von KI-Modellen in KI-Fabriken entwickelt wurde. Dieser zukunftsweisende Ansatz stellt sicher, dass Unternehmen ihre agentenbasierten KI-Anwendungen zuverlässig skalieren und gleichzeitig Sicherheit und Compliance gewährleisten können.
Beteiligen Sie sich an StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed