鎧俠宣布對其 AiSAQ(帶乘積量化的全儲存人工神經網路 (ANNS))軟體進行重大更新,進一步提升了檢索增強生成 (RAG) 系統中 AI 向量資料庫搜尋的可用性和靈活性。此最新開源版本引入了新的配置選項,使系統架構師能夠精確調整搜尋效能和向量容量之間的平衡。由於現代 AI 基礎架構中 SSD 的儲存容量固定,這兩個因素本質上是相互矛盾的。
RAG 系統的彈性調整
這次 AiSAQ 更新的核心在於,管理員能夠定義儲存向量數量與可實現的搜尋效能(每秒查詢次數)之間的最佳平衡。實際上,當 SSD 容量固定時,提升搜尋效能需要為每個向量分配更多儲存空間,這會減少可索引的向量總數。相反,最大化向量數量意味著每個向量佔用的 SSD 容量更少,這會影響搜尋速度。 AiSAQ 中的新控制項可讓架構師根據特定的工作負載需求微調此平衡,而無需變更或升級硬體。
這種靈活性對於 RAG 系統尤其重要,因為其工作負載的性質可以在高吞吐量、低延遲搜尋和大規模向量儲存之間快速切換。此次更新還擴展了 AiSAQ 的適用性,使其成為離線語義搜尋等其他向量密集型應用的理想解決方案,因為在這些應用中,效能和容量之間的權衡也至關重要。
消除 DRAM 瓶頸
鎧俠 AiSAQ 於今年 1 月首次推出,它採用了專門針對 SSD 優化的全新近似最近鄰搜尋 (ANNS) 演算法。與嚴重依賴 DRAM 儲存索引資料的傳統向量搜尋解決方案不同,AiSAQ 支援在 SSD 上直接進行向量搜尋操作,從而顯著降低了主機記憶體需求。這種架構上的轉變使向量資料庫能夠遠遠超越 DRAM 容量的限制,從而使大規模生成式 AI 和 RAG 部署更加實用且經濟高效。
隨著可擴展 AI 服務需求的持續成長,SSD 正逐漸成為 DRAM 的實用替代方案,以滿足現代 AI 系統所需的高吞吐量和低延遲。鎧俠的 AiSAQ 軟體旨在利用這一趨勢,實現高效的大規模向量搜索,擺脫傳統系統架構師面臨的記憶體限制。
開源,更廣泛採用
透過開源 AiSAQ,鎧俠積極推廣以 SSD 為中心的架構,並推動可擴展 AI 系統的更廣泛應用。公司對開源技術的承諾不僅提升了開發人員和系統架構師的可近性,也促進了整個 AI 生態系統的創新。
鎧俠 SSD 業務部高級副總裁兼總經理 Neville Ichhaporia 強調,最新版 AiSAQ 提供了先進的工具,可提升可擴展 RAG 系統的性能和容量。他指出,鎧俠透過支持開源開發,正在協助推動 AI 基礎設施的可及性和創新性。
鎧俠最新的 AiSAQ 更新,標誌著建立可擴展、基於 SSD 的 AI 基礎架構的組織邁出了重要的一步。憑藉靈活的配置選項、無 DRAM 架構和開源可用性,AiSAQ 能夠充分支援 RAG 系統和其他向量驅動型 AI 應用不斷變化的需求。
下載和可用性
更新後的 KIOXIA AiSAQ 開源軟體現已發布,可直接從 GitHub 下載:
https://github.com/kioxia-jp/aisaq-diskann




Amazon