首页 企业版AI Microsoft Ignite 2024:定制芯片和 AI 基础设施的进步

Microsoft Ignite 2024:定制芯片和 AI 基础设施的进步

by 迪维扬什·贾恩

微软在本周的 Microsoft Ignite 活动上公布了定制芯片设计和 AI 基础设施方面的几项新进展,包括扩大其硅片产品组合。

微软在 Ignite 2024 上宣布了定制芯片设计和 AI 基础设施方面的几项关键进展。该公司正在通过新的安全和数据处理芯片扩展其硅片产品组合,同时加强与 NVIDIA 在 AI 计算方面的合作。这些更新旨在提高微软云服务的效率、安全性和性能。

微软的定制硅片革命

微软正在大力扩展其定制芯片产品组合,使其不再局限于 Azure Maia AI 加速器和 Azure Cobalt CPU。他们推出了 Azure Integrated HSM,这是一款内部安全芯片,旨在增强密钥管理而不影响性能。2025 年,微软将在所有新的数据中心服务器中添加 HSM 安全模块,以保护机密和通用工作负载。

微软还推出了其首款数据处理单元 Azure Boost DPU。这款专用芯片能够以卓越的效率处理以数据为中心的工作负载。配备这款 DPU 的新服务器将减少三分之二的功耗,性能比现有服务器高出四倍。

冷却和电力基础设施

微软展示了其下一代液体冷却“sidekick”机架。该热交换器单元可以改装到 Azure 数据中心,以支持大型 AI 系统,包括 NVIDIA 的 GB200 基础设施。他们还与 Meta 合作设计了一种采用 400 伏直流电源的分解式电源机架,使每个服务器机架中的 AI 加速器数量最多增加 35%。

为了推动整个行业的进步,微软通过开放计算项目开源这些冷却和电源机架规格,让整个行业都能从这些创新中受益。

下一代人工智能和计算基础设施

随着采用 NVIDIA H200 GPU 的 ND H5 V200 虚拟机系列的推出,Azure 的 AI 基础架构不断发展。该平台表现出显著的性能增强,在 NVIDIA H100 和 H200 GPU 之间超越了行业基准测试标准两倍。

微软还宣布推出 Azure ND GB200 v6,这是一款新的 AI 优化 VM 系列,结合了 NVIDIA GB200 NVL 72 机架规模设计和 Quantum InfiniBand 网络。这一进步实现了大规模 AI 超级计算性能,连接了数万个 Blackwell GPU。

对于基于 CPU 的超级计算,由定制的 AMD EPYC™ 5V9H 处理器提供支持的全新 Azure HBv64 虚拟机承诺比当前替代方案提供高达八倍的性能,并将于 2025 年提供预览版。

Azure 容器应用程序与 NVIDIA 集成

Azure 容器应用现在支持 NVIDIA GPU,从而实现简化且可扩展的 AI 部署。此无服务器容器平台通过抽象底层基础架构,简化了基于微服务的应用程序的部署和管理。借助按秒计费和缩放到零的功能,客户只需为他们使用的计算付费,从而确保经济高效的资源利用率。

Azure 上的 NVIDIA AI 平台包括用于创建沉浸式 AI 视觉效果的工业 AI 和 NVIDIA Omniverse Blueprint 的新参考工作流程。工业运营 3D 远程监控的参考工作流程即将推出,使开发人员能够将物理上精确的工业系统 3D 模型连接到 Azure IoT Operations 和 Power BI 的实时数据。

RTX AI PC 和高级计算

NVIDIA 宣布推出其新的多模态 SLM——NVIDIA Nemovision-4B Instruct,用于理解现实世界和屏幕上的视觉图像。这项技术即将引入 RTX AI PC 和工作站,将增强数字人类互动的真实感。

NVIDIA TensorRT 模型优化器 (ModelOpt) 的更新现在为 Windows 开发人员提供了一种改进的方法来优化 ONNX 运行时部署模型。这使开发人员能够为 PC 创建 AI 模型,这些模型在 RTX GPU 加速后会更快、更准确,同时可以轻松地通过 ONNX 运行时在整个 PC 生态系统中部署。

超过 600 个 Windows 应用和游戏在全球超过 100 亿台 GeForce RTX AI PC 上本地运行 AI,提供快速、可靠且低延迟的性能。NVIDIA 与 Microsoft 之间的合作继续推动个人计算设备的创新,为日常用户带来先进的 AI 功能。

Microsoft 云和混合基础设施

Azure Arc 体现了微软对多云和混合解决方案的承诺,目前它为全球超过 39,000 家客户提供服务。新的 Azure Local 提供安全的云连接混合基础设施和灵活的选项,包括用于 AI 推理的 GPU 服务器。

微软还宣布推出 Windows Server 2025 和 SQL Server 2025,利用 Azure Arc 在本地和云环境中提供云功能。SQL Server 2025 以其新的内置 AI 功能脱颖而出,通过矢量支持简化了 AI 应用程序开发和 RAG 模式。

结语

微软最近的创新凸显了其致力于推进定制芯片、人工智能基础设施和混合云解决方案。凭借 Azure Integrated HSM 和 Azure Boost DPU 等突破性发展,微软正在为安全、高效、高性能的数据中心运营树立新典范。下一代冷却和电源技术以及开源创新的推出凸显了微软致力于促进行业协作和可持续发展的承诺。

Azure 的 AI 和计算基础设施(包括 ND H200 V5 和 ND GB200 v6 虚拟机)的演进证明了微软大规模提供 AI 性能的能力。同时,新的 HBv5 虚拟机有望实现基于 CPU 的超级计算性能,确保 Azure 在高性能计算领域保持领先地位。

最后,借助 Azure Arc 强大的混合功能以及 SQL Server 2025 等 AI 增强工具的推出,微软为企业提供了灵活、可扩展的解决方案,以应对现代工作负载的复杂性。这些进步共同巩固了微软在推动 AI、云和混合基础设施未来发展方面的领先地位。

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅