NVIDIA 和 Google Cloud 合作透過 Blackwell HGX 和 DGX 平台為使用 Google Gemini AI 模型的企業帶來代理 AI。
NVIDIA 宣布與 Google Cloud 建立策略合作夥伴關係,向企業推出代理 AI。此次合作使企業能夠透過 NVIDIA 的 Blackwell HGX 和 DGX 平台以及 NVIDIA 機密運算在本地使用 Google Gemini 系列 AI 模型,從而增強資料安全性。
利用 NVIDIA Blackwell 實現合規性和安全性
NVIDIA Blackwell 平台與 Google 分散式雲端集成,使本地資料中心能夠滿足監管要求和資料主權法律。企業可以透過限制對敏感資訊(例如病患記錄、金融交易和機密政府資料)的存取來確保合規性,同時保持營運效率。此外,NVIDIA 機密運算可保護 Gemini 模型中的敏感程式碼,防止未經授權的存取和潛在的資料外洩。
Google Cloud 基礎設施和解決方案副總裁兼總經理 Sachin Gupta 強調,此次合作使企業能夠安全地利用代理 AI 的全部潛力,將 NVIDIA Blackwell 的效能和機密運算能力與操作簡單性相結合。
雙層安全
採用 NVIDIA Blackwell 進行機密運算為企業提供了技術保障,確保使用者對 Gemini 模型的應用程式介面 (API) 的提示和用於微調的資料保持安全。這種雙層安全性可防止未經授權的存取或篡改,使企業能夠使用 Gemini 模型自信地進行創新,同時保護資料隱私。
本地部署困境
儘管多模態推理取得了進展——整合文字、圖像、程式碼和其他資料類型來解決複雜問題——但對安全性或資料主權有嚴格要求的企業在採用這些技術時仍面臨挑戰。此次合作解決了這些挑戰,使 Google Cloud 成為首批提供機密運算功能的供應商之一,用於保護所有環境(無論是基於雲端還是混合環境)中的代理 AI 工作負載。
該解決方案由配備 Blackwell GPU 和 NVIDIA 機密運算的 NVIDIA HGX B200 平台提供支持,使客戶能夠保護其 AI 模型和數據,同時實現突破性的效能和能源效率。企業現在可以在不影響創新的情況下維護資料安全和模型完整性。
Agentic AI 的 AI 可觀察性和安全性
在生產中擴展代理 AI 需要強大的可觀察性和安全性,以確保可靠的效能和合規性。為了解決這個問題,Google Cloud 推出了 GKE 推理網關,旨在透過進階路由和可擴展性優化 AI 推理工作負載的部署。透過與 NVIDIA Triton 推理伺服器和 NVIDIA NeMo Guardrails 集成,該網關提供智慧負載平衡,可提高效能並降低服務成本。它還支援集中模型安全和治理。
展望未來,Google Cloud 計畫透過整合 NVIDIA Dynamo(一個旨在為 AI 工廠提供服務和擴展推理 AI 模型的開源庫)來增強代理 AI 工作負載的可觀察性。這種前瞻性的方法確保企業能夠自信地擴展其代理 AI 應用程序,同時保持安全性和合規性。
參與 StorageReview
電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱