NVIDIA DOCA Argus 为 AI 工作负载提供实时、无代理的威胁检测,使用 BlueField DPU 来增强安全性而不影响性能。
随着企业加速 AI 应用,保护“AI 工厂”(执行复杂代理工作流程的基础设施)的需求变得前所未有的紧迫。NVIDIA 的最新进展,尤其是在 BlueField DPU 上运行的 DOCA 软件框架,重塑了企业处理 AI 工作负载运行时网络安全的方式。本文探讨了 CPU 和 DPU 在此背景下的不同作用,重点介绍 DOCA 如何利用 DPU 架构来提供下一代安全性。
CPU、DPU 和 DOCA
CPU 长期以来一直是通用计算的支柱,处理从应用逻辑到系统管理的各种任务。相比之下,DPU 则专门用于卸载和加速以数据为中心的操作,例如网络、存储和安全,从而释放 CPU 资源用于核心业务逻辑。
NVIDIA DOCA(数据中心芯片基础设施架构)是一个软件框架,旨在释放 BlueField DPU。DOCA 提供了一个平台,用于直接在 DPU 上构建、部署和管理数据中心服务(包括高级安全性),独立于主机 CPU。
架构比较:CPU 与 DPU 在 AI 安全方面的比较
传统的运行时安全方法依赖于在 CPU 上运行的主机代理。虽然这种模型在许多情况下有效,但它会带来开销,可能会影响性能,并且如果主机受到攻击,则容易受到攻击。相比之下,DPU 独立于主机运行,从而实现高效且具有弹性的带外安全操作。
以下是 DOCA 支持的 AI 安全背景下 CPU 和 DPU 策略的高级比较。
特性/能力 | CPU(基于主机) | DPU(BlueField 与 DOCA) |
---|---|---|
安全运营 | 在主机上运行,使用代理 | 在 DPU 上运行,无需代理 |
性能影响 | 可能会引入开销 | 主机工作负载零开销 |
攻击者的可见性 | 可见,可以禁用 | 隐形,与宿主隔离 |
之路 | 需要主机集成 | 与企业安全平台(SIEM、SOAR、XDR)集成 |
弹性 | 如果主机被入侵,则容易受到攻击 | 如果主机受到攻击,仍可继续运行 |
可扩展性 | 受主机资源限制 | 通过 DPU 部署进行扩展 |
DOCA Argus:实时、无代理威胁检测
NVIDIA DOCA Argus 充分体现了以 DPU 为中心的方法的优势。Argus 完全基于 BlueField DPU 运行,利用先进的内存取证技术提供实时威胁检测,据 NVIDIA 称,其检测速度比传统无代理解决方案快 1,000 倍。由于所有安全操作都从主机 CPU 卸载,因此不会影响系统性能。
Argus 的无代理设计意味着无需软件代理或基于主机的集成,从而降低了操作复杂性和攻击面。由于 Argus 在主机外部运行,即使主机系统受到攻击,攻击者也无法发现它。与企业安全平台(SIEM、SOAR、XDR)集成,可实现持续监控和自动威胁缓解,将现有的网络安全功能扩展到 AI 基础设施。
用例:大规模保护 AI 工作负载
多租户AI工厂
在多个团队或客户共享同一 AI 基础架构的环境中,隔离和保护工作负载至关重要。配备 DOCA Argus 的 BlueField DPU 为容器化和多租户环境提供运行时保护,确保在不影响性能或无需更改主机的情况下检测并控制威胁。
自治数据中心
随着企业大规模部署代理型AI模型和自主代理,数据量和速度都急剧增长。DOCA Argus 已针对真实威胁情报进行优化,仅显示已验证的威胁,从而减少误报并减轻安全团队的警报疲劳。这使得企业即使在 AI 运营规模扩大的情况下也能保持强大的安全态势。
行业合作与生态系统
NVIDIA 和思科正携手打造安全的人工智能 (AI) 系统。通过在 AI 流程的各个层面(从硬件到软件)添加安全保障,企业可以安心地使用和扩展其 AI 应用,因为他们知道从一开始便已内置安全保护。
正如思科执行副总裁兼首席产品官 Jeetu Patel 所指出的,解锁创新 AI 用例的关键在于从一开始就确保安全可靠。NVIDIA 和思科的联合架构为企业在扩展 AI 的同时保护其最宝贵的数据奠定了基础。
DPU在AI安全方面的优势
从使用 CPU 到使用 DPU 来保障安全,标志着我们保护 AI 工厂的方式发生了重大变化。借助 NVIDIA DOCA 等框架,企业可以使用 DPU 管理安全任务。这使得他们无需代理即可实时检测威胁,从而使攻击者更难发现他们的安全措施。这种方法在保持高性能和高效率的同时,提高了安全性。这些方面对于当今的大规模 AI 系统至关重要。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅