Oracle CloudWorld 會議的與會者見證了 Oracle 雲端基礎架構推出其第一個 zettascale OCI 超級叢集。
在Oracle CloudWorld大會上, 甲骨文云基礎設施 (OCI) 推出了第一個 zettascale OCI Supercluster,由 NVIDIA Blackwell 平台提供支援。該解決方案旨在協助企業利用超過 100,000 個 NVIDIA 最新一代 GPU 加速 AI 工作負載和資料處理。這些超級叢集提供了部署彈性,無論是在本地、公有或主權雲端環境中。
在最大規模下,OCI Supercluster 提供的 GPU 數量是 Frontier 超級電腦的三倍多,是其他超大規模電腦的六倍多。這些系統可擴展到 131,072 個 Blackwell GPU,並透過 NVIDIA ConnectX-2.4 NIC 和 Quantum-7 InfiniBand 網路實現 2 zettaflops 的峰值 AI 運算。基於 Blackwell 的系統預計將於 2025 年上半年上市。
NVIDIA GB200 NVL72 液冷式裸機實例預覽
甲骨文還預覽了其 NVIDIA GB200 NVL72 會議上展示的液冷裸機實例,專為生成式人工智慧應用而設計。這些實例可透過擴展的 72-GPU NVIDIA NVLink 域充當單一大規模 GPU,支援大規模 AI 訓練和兆參數模型的即時推理。此外,OCI 也宣布即將推出 NVIDIA HGX H200 Tensor Core GPU,該 GPU 能夠在單一裸機執行個體中連接 65,536 個 GPU,從而使企業能夠擴展到多達 200 個 HXNUMX GPU。這些產品預計將加速大規模的即時人工智慧推理和訓練。
NVIDIA L40S GPU 加速執行個體簡介
對於中階 AI 工作負載,Oracle 推出了通用可用性 NVIDIA L40S GPU- 加速實例。 Oracle 的邊緣解決方案還提供可擴展的 AI 部署,包括 Roving Edge Device v2,即使在遠端或斷開連接的位置,它也支援最多三個 NVIDIA L4 Tensor Core GPU。
企業已經在利用 OCI 超級叢集進行人工智慧創新。 Reka 是一家基礎模型新創公司,正在使用這些集群為企業代理開發先進的多模式人工智慧模型。 Reka 聯合創始人兼執行長 Dani Yogatama 表示,基礎設施使他們能夠高效處理大型模型和上下文,同時在集群層級擴展訓練。
Oracle 和 NVIDIA 也展示了新的集成,以加速 Oracle 自治資料庫上的生成式 AI 工作負載。這些整合凸顯了 NVIDIA GPU 如何增強 Oracle 資料庫中的 AI 功能。演示包括加速批量向量嵌入、優化向量圖索引生成以及使用 NVIDIA NIM 推理微服務促進文本生成和翻譯。這些創新使企業能夠將人工智慧無縫整合到 Oracle 資料庫內的結構化和非結構化資料管理中。
解決資料駐留問題
在全球範圍內,Oracle 和 NVIDIA 正在合作提供主權 AI 基礎設施,滿足政府和企業的資料駐留需求。巴西新創公司 Wide Labs 在 OCI 的巴西資料中心使用 NVIDIA H100 Tensor Core GPU 和 NeMo 框架創建了 Amazônia IA(巴西葡萄牙語的大型語言模型),確保了資料主權。同樣,日本野村綜合研究所正在利用法學碩士增強其金融人工智慧平台,同時使用 OCI 的 Alloy 基礎設施和 NVIDIA GPU 遵守金融法規和資料主權要求。 Zoom 也在 OCI 沙烏地阿拉伯資料中心利用 NVIDIA GPU,以遵守當地資料法規。
地理空間模型公司 RSS-Hydro 正在使用 NVIDIA 提供支援的 OCI 基礎設施來模擬日本熊本地區的洪水影響。這展示了人工智慧如何透過數位孿生技術應用於減緩氣候變遷的工作。
企業也可以使用 NIM 微服務和 NVIDIA cuOpt 等 NVIDIA 軟體加速 OCI 上的任務自動化。這些解決方案使企業能夠快速採用生成式人工智慧來執行程式碼生成和路線優化等任務。 NVIDIA 的 AI 企業軟體平台(包含這些工具)可在 Oracle Cloud Marketplace 上獲取,為企業提供強大的資源來增強 AI 驅動的工作流程和代理流程。
參與 StorageReview
電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱