Entreprise

NVIDIA et Google Cloud s'associent pour apporter l'IA agentique aux entreprises

NVIDIA et Google Cloud collaborent pour apporter l'IA agentique aux entreprises utilisant les modèles d'IA Google Gemini via les plateformes Blackwell HGX et DGX.

NVIDIA a annoncé un partenariat stratégique avec Google Cloud pour introduire l'IA agentique dans les entreprises. Cette collaboration permet aux entreprises d'utiliser localement la gamme de modèles d'IA Google Gemini via les plateformes Blackwell HGX et DGX de NVIDIA et NVIDIA Confidential Computing pour une sécurité renforcée des données.

Activation de la conformité et de la sécurité avec NVIDIA Blackwell

La plateforme NVIDIA Blackwell, intégrée à Google Distributed Cloud, permet aux centres de données sur site de respecter les exigences réglementaires et les lois sur la souveraineté des données. Les entreprises peuvent garantir leur conformité tout en préservant leur efficacité opérationnelle en limitant l'accès aux informations sensibles telles que les dossiers patients, les transactions financières et les données gouvernementales classifiées. De plus, NVIDIA Confidential Computing protège le code sensible au sein des modèles Gemini, le protégeant ainsi des accès non autorisés et des violations de données potentielles.

Sachin Gupta, vice-président et directeur général de l'infrastructure et des solutions chez Google Cloud, a souligné que le partenariat permet aux entreprises d'exploiter en toute sécurité tout le potentiel de l'IA agentique, en combinant les performances et les capacités de calcul confidentiel de NVIDIA Blackwell avec la simplicité opérationnelle.

Sécurité à double couche

L'informatique confidentielle avec NVIDIA Blackwell offre aux entreprises l'assurance technique que les invites des utilisateurs à accéder à l'interface de programmation d'applications (API) des modèles Gemini et les données utilisées pour le réglage fin restent sécurisées. Cette sécurité à double couche protège contre les accès non autorisés et les falsifications, permettant aux entreprises d'innover en toute confiance avec les modèles Gemini tout en préservant la confidentialité des données.

Le dilemme sur site

Malgré les avancées du raisonnement multimodal (intégration de texte, d'images, de code et d'autres types de données pour résoudre des problèmes complexes), les entreprises soumises à des exigences strictes en matière de sécurité ou de souveraineté des données ont rencontré des difficultés pour adopter ces technologies. Ce partenariat répond à ces défis en faisant de Google Cloud l'un des premiers fournisseurs à proposer des capacités de calcul confidentiel pour sécuriser les charges de travail d'IA agentique dans tous les environnements, qu'ils soient cloud ou hybrides.

Basée sur la plateforme NVIDIA HGX B200 intégrant les GPU Blackwell et NVIDIA Confidential Computing, cette solution permet aux clients de protéger leurs modèles et données d'IA tout en bénéficiant de performances et d'une efficacité énergétique exceptionnelles. Les entreprises peuvent désormais préserver la sécurité des données et l'intégrité des modèles sans compromettre l'innovation.

Observabilité et sécurité de l'IA pour l'IA agentique

La mise à l'échelle de l'IA agentique en production nécessite une observabilité et une sécurité robustes pour garantir des performances et une conformité fiables. Pour y remédier, Google Cloud a lancé GKE Inference Gateway, conçue pour optimiser le déploiement des charges de travail d'inférence IA grâce à un routage et une évolutivité avancés. En s'intégrant à NVIDIA Triton Inference Server et NVIDIA NeMo Guardrails, la passerelle offre un équilibrage de charge intelligent qui améliore les performances et réduit les coûts de service. Elle permet également une sécurité et une gouvernance centralisées des modèles.

À l'avenir, Google Cloud prévoit d'améliorer l'observabilité des charges de travail d'IA agentique en intégrant NVIDIA Dynamo, une bibliothèque open source conçue pour servir et faire évoluer les modèles d'IA raisonnée dans les usines d'IA. Cette approche prospective permet aux entreprises de faire évoluer leurs applications d'IA agentique en toute confiance, tout en préservant la sécurité et la conformité.

S'engager avec StorageReview

Newsletter |  YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Flux RSS

Harold Fritt

Je suis dans l'industrie de la technologie depuis qu'IBM a créé Selectric. Ma formation, cependant, est l'écriture. J'ai donc décidé de sortir de l'avant-vente et de revenir à mes racines, en écrivant un peu mais en restant impliqué dans la technologie.

Derniers Articles

Dell étend le stockage, le cloud et l'automatisation Edge pour alimenter les centres de données intelligents

Lors du salon DTW 2025, Dell a dévoilé des avancées significatives en matière de stockage, de cyber-résilience, d'automatisation du cloud privé et d'opérations de périphérie avec NativeEdge. (suite…)

Il y a 13 heures

AMD dévoile les cartes graphiques Threadripper 9000, Radeon R9700 et RX 9060 XT

AMD dévoile les processeurs Ryzen Threadripper 9000, le GPU Radeon AI PRO R9700 et le GPU RX 9060 XT au COMPUTEX 2025, élargissant ainsi…

Jour il ya 1

HPE déploie une pile d'IA améliorée avec cloud privé, SDK de stockage Alletra et prise en charge du GPU Blackwell

HPE met à jour son infrastructure d'IA avec des serveurs ProLiant, Private Cloud AI, Alletra SDK et la prise en charge d'OpsRamp pour RTX PRO 6000…

Jour il ya 1

Au cœur de l'usine d'IA de Dell : nouveaux serveurs refroidis par liquide, GPU RTX Pro et solutions d'IA de bout en bout

Dell étend son usine d'IA avec NVIDIA, en ajoutant de nouveaux serveurs PowerEdge, une mise en réseau plus rapide et des services gérés pour l'adoption de l'IA en entreprise.

Il y a 2 jours

Dell dévoile la station de travail mobile Pro Max Plus équipée du processeur NPU AI-100 de Qualcomm

La nouvelle station de travail Pro Max Plus de Dell avec Qualcomm AI-100 NPU offre une inférence d'IA de niveau entreprise aux professionnels mobiles en périphérie.…

Il y a 2 jours

Intel élargit sa gamme Arc Pro avec les GPU B50 et B60, ciblant les charges de travail d'IA et de graphisme

Intel lancera les GPU Arc Pro B50 et B60 au Computex 2025. Ces GPU permettent une inférence IA avancée et des performances de station de travail…

Il y a 2 jours