ScyllaDB发布集成向量搜索功能,面向实时AI支持十亿级向量检索

richlovec 1500_400 (1)
 

ScyllaDB今日宣布,其新向量搜索功能正式发布,并已集成至ScyllaDB云服务。公司表示,该高性能向量搜索可支持业内最大规模的模型,同时降低总拥有成本。

ScyllaDB通常用于实时人工智能相关工作负载,包括对延迟敏感的机器学习、预测分析和欺诈检测。公司称,Tripadvisor、ShareChat和Freshworks等高速成长企业使用ScyllaDB为大规模、低延迟的特征存储提供支撑。随着客户开始采用向量搜索,一些用户反馈独立向量数据库在大规模应用中部署复杂且成本较高,ScyllaDB因此将向量搜索能力纳入其云服务体系。

在架构层面,ScyllaDB向量搜索基于其每核分片(per-core sharding)架构,并通过基于Rust的扩展引入USearch近似最近邻(ANN)搜索库。该设计将存储与索引职责分离,但在用户视角下保持系统统一:一方面,ScyllaDB节点在同一分布式表中同时存储结构化属性与向量嵌入;另一方面,专用向量存储服务通过变更数据捕获(CDC)从ScyllaDB接收更新,并在内存中构建ANN索引;当查询发送至数据库后,系统会在内部将请求路由至向量存储服务完成检索。

公司称,上述分层设计使各层能够独立扩展,并可针对不同工作负载特性进行优化,从而减少资源相互干扰。

ScyllaDB表示,其硬件优化的每核分片架构适用于高操作数查询;同时,USearch的C++实现相较FAISS在性能上提升10倍。公司称,两者结合可实现业内领先的首次令牌响应时间。

在最近一次十亿向量基准测试中,ScyllaDB称其向量搜索在大规模相似性搜索场景下实现了低于2毫秒的P99延迟,吞吐量最高约25万次查询每秒。该测试使用公开的yandex-deep 1b数据集(包含10亿向量),并采用3+3节点配置,以贴近真实生产部署环境。

ScyllaDB联合创始人兼CEO Dor Laor表示,基于公开基准结果,ScyllaDB展示了在十亿向量规模下的快速向量搜索性能,并在不同模型规模上提供较优的总拥有成本;这使团队能够在不进行传统性能与成本取舍的情况下,支持并扩展更大规模的AI推理工作负载。


分享:


发表评论

登录后才可评论。 去登录