NVIDIA et Google Cloud collaborent pour apporter l'IA agentique aux entreprises utilisant les modèles d'IA Google Gemini via les plateformes Blackwell HGX et DGX.
NVIDIA a annoncé un partenariat stratégique avec Google Cloud pour introduire l'IA agentique dans les entreprises. Cette collaboration permet aux entreprises d'utiliser localement la gamme de modèles d'IA Google Gemini via les plateformes Blackwell HGX et DGX de NVIDIA et NVIDIA Confidential Computing pour une sécurité renforcée des données.
La plateforme NVIDIA Blackwell, intégrée à Google Distributed Cloud, permet aux centres de données sur site de respecter les exigences réglementaires et les lois sur la souveraineté des données. Les entreprises peuvent garantir leur conformité tout en préservant leur efficacité opérationnelle en limitant l'accès aux informations sensibles telles que les dossiers patients, les transactions financières et les données gouvernementales classifiées. De plus, NVIDIA Confidential Computing protège le code sensible au sein des modèles Gemini, le protégeant ainsi des accès non autorisés et des violations de données potentielles.
Sachin Gupta, vice-président et directeur général de l'infrastructure et des solutions chez Google Cloud, a souligné que le partenariat permet aux entreprises d'exploiter en toute sécurité tout le potentiel de l'IA agentique, en combinant les performances et les capacités de calcul confidentiel de NVIDIA Blackwell avec la simplicité opérationnelle.
L'informatique confidentielle avec NVIDIA Blackwell offre aux entreprises l'assurance technique que les invites des utilisateurs à accéder à l'interface de programmation d'applications (API) des modèles Gemini et les données utilisées pour le réglage fin restent sécurisées. Cette sécurité à double couche protège contre les accès non autorisés et les falsifications, permettant aux entreprises d'innover en toute confiance avec les modèles Gemini tout en préservant la confidentialité des données.
Malgré les avancées du raisonnement multimodal (intégration de texte, d'images, de code et d'autres types de données pour résoudre des problèmes complexes), les entreprises soumises à des exigences strictes en matière de sécurité ou de souveraineté des données ont rencontré des difficultés pour adopter ces technologies. Ce partenariat répond à ces défis en faisant de Google Cloud l'un des premiers fournisseurs à proposer des capacités de calcul confidentiel pour sécuriser les charges de travail d'IA agentique dans tous les environnements, qu'ils soient cloud ou hybrides.
Basée sur la plateforme NVIDIA HGX B200 intégrant les GPU Blackwell et NVIDIA Confidential Computing, cette solution permet aux clients de protéger leurs modèles et données d'IA tout en bénéficiant de performances et d'une efficacité énergétique exceptionnelles. Les entreprises peuvent désormais préserver la sécurité des données et l'intégrité des modèles sans compromettre l'innovation.
La mise à l'échelle de l'IA agentique en production nécessite une observabilité et une sécurité robustes pour garantir des performances et une conformité fiables. Pour y remédier, Google Cloud a lancé GKE Inference Gateway, conçue pour optimiser le déploiement des charges de travail d'inférence IA grâce à un routage et une évolutivité avancés. En s'intégrant à NVIDIA Triton Inference Server et NVIDIA NeMo Guardrails, la passerelle offre un équilibrage de charge intelligent qui améliore les performances et réduit les coûts de service. Elle permet également une sécurité et une gouvernance centralisées des modèles.
À l'avenir, Google Cloud prévoit d'améliorer l'observabilité des charges de travail d'IA agentique en intégrant NVIDIA Dynamo, une bibliothèque open source conçue pour servir et faire évoluer les modèles d'IA raisonnée dans les usines d'IA. Cette approche prospective permet aux entreprises de faire évoluer leurs applications d'IA agentique en toute confiance, tout en préservant la sécurité et la conformité.
S'engager avec StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Flux RSS
Lors du salon DTW 2025, Dell a dévoilé des avancées significatives en matière de stockage, de cyber-résilience, d'automatisation du cloud privé et d'opérations de périphérie avec NativeEdge. (suite…)
AMD dévoile les processeurs Ryzen Threadripper 9000, le GPU Radeon AI PRO R9700 et le GPU RX 9060 XT au COMPUTEX 2025, élargissant ainsi…
HPE met à jour son infrastructure d'IA avec des serveurs ProLiant, Private Cloud AI, Alletra SDK et la prise en charge d'OpsRamp pour RTX PRO 6000…
Dell étend son usine d'IA avec NVIDIA, en ajoutant de nouveaux serveurs PowerEdge, une mise en réseau plus rapide et des services gérés pour l'adoption de l'IA en entreprise.
La nouvelle station de travail Pro Max Plus de Dell avec Qualcomm AI-100 NPU offre une inférence d'IA de niveau entreprise aux professionnels mobiles en périphérie.…
Intel lancera les GPU Arc Pro B50 et B60 au Computex 2025. Ces GPU permettent une inférence IA avancée et des performances de station de travail…