鎧俠開源軟件推動 AI RAG 的發展
通過優化固態驅動器 (SSD) 的使用,不斷努力提高檢索增強一代 (RAG) 系統中 AI 矢量數據庫搜索的可用性,鎧俠株式會社宣布更新其鎧俠 AiSAQ?(帶產品量化的全存儲 ANNS)軟件。
這個新的開源版本引入了靈活的控制,允許系統架構師定義搜索性能和向量數量之間的平衡點,向量數量是系統中 SSD 存儲固定容量的對立因素。由此產生的好處使 RAG 系統的架構師能夠微調特定工作負載及其要求的最佳平衡,而無需進行任何硬件修改。
鎧俠AiSAQ軟件于2025年1月首次推出,它采用了一種新穎的近似最近鄰搜索(ANNS)算法,該算法針對SSD進行了優化,無需將索引數據存儲在DRAM中。通過直接在 SSD 上實現矢量搜索并降低主機內存要求,鎧俠 AiSAQ RAG 技術使矢量數據庫能夠擴展,在很大程度上不受 DRAM 容量限制的限制。
當系統中 SSD 的安裝容量固定時,提高搜索性能 (每秒查詢數) 需要每個向量消耗更多的 SSD 容量。這會導致向量數量減少。相反,為了最大化向量的數量,需要減少每個向量的 SSD 容量消耗,這會導致性能降低。這兩種相反條件之間的最佳平衡因特定工作負載而異。為了找到合適的天平,鎧俠 AiSAQ 軟件引入了靈活的配置選項。最新更新使管理員能夠為 RAG 系統內的各種工作負載選擇最佳平衡。此外,此次更新使鎧俠 AiSAQ 技術成為基于 SSD 的 ANNS,不僅適用于 RAG 應用,還適用于其他需要向量的應用,例如離線語義搜索。
隨著對可擴展 AI 服務的需求不斷增長,SSD 為 DRAM 提供了一種實用的替代方案,用于管理 RAG 系統所需的高吞吐量和低延遲。鎧俠 AiSAQ 軟件能夠有效滿足這些需求,允許大規模生成式 AI,而不受有限內存資源的限制。
評論