1.常见向量数据库

名称 类型 开源协议 分布式 核心索引算法 相似度度量 亮点 典型场景
Milvus 开源 + 托管云(Zilliz Cloud) Apache 2.0 ✅ 原生支持 HNSW, IVF, ANNOY, DiskANN L2, IP, 余弦 云原生架构,生态完善(LangChain/LlamaIndex 深度集成),支持标量过滤 大规模生产环境、高并发检索
Qdrant 开源 + 托管云 Apache 2.0 ✅(集群版) HNSW + 量化 余弦, L2, 点积 Rust 高性能,过滤语法灵活(类似 SQL),gRPC/HTTP 双协议 需要复杂过滤的实时搜索
Weaviate 开源 + 托管云 BSD-3 HNSW 余弦, L2, 点积 混合搜索(向量+关键词+Bm25),内置嵌入模型,GraphQL API 语义+关键词融合搜索场景
Chroma 开源(轻量级) Apache 2.0 ❌(单机为主) HNSW(hnswlib) L2, 余弦 极简易用,Python/JS 友好,LangChain 默认集成 原型开发、小规模测试、教学
Pinecone 全托管商业 闭源 ✅(自动扩缩容) 专有优化 余弦, L2, 点积 零运维,Serverless 架构,自动索引优化 无运维团队、快速上线项目
pgvector PostgreSQL 扩展 PostgreSQL 许可 依赖 PG 集群 IVFFlat, HNSW(PG ≥16) L2, 余弦, 内积 无缝嵌入现有 PG 业务,ACID 事务支持 已有 PostgreSQL、需向量+结构化数据联合查询
LanceDB 开源(嵌入式) Apache 2.0 ❌(单机) IVF, HNSW L2, 余弦 基于 Apache Arrow,支持本地/云存储,Python/Rust 边缘设备、Notebook 快速实验
FAISS ANN 库(非数据库) MIT 多种(HNSW, PQ 等) 多种 Meta 出品,算法丰富,高性能 需自研存储层、研究/定制化场景
  • 云服务:Google Vertex AI Vector Search、AWS OpenSearch Serverless(向量)、Azure Cognitive Search(向量插件)——适合深度绑定云厂商的团队。
  • 传统数据库扩展:RedisSearch(Redis 模块,需要新一些版本)、Elasticsearch/OpenSearch(k-NN 插件)——适合已有技术栈且向量需求较轻。

1.数据规模与运维能力
a.小规模/实验:Chroma、LanceDB。可以作为嵌入,适合本地测试
b.大规模/生产:Milvus、Qdrant(自建)或 Pinecone(免运维)
c.已有 PostgreSQL:优先评估 pgvector
2.功能需求
a.需混合搜索(关键词+向量):Weaviate
b.需复杂过滤:Qdrant、Milvus
c.需事务/结构化查询:pgvector
3.生态与集成
LangChain/LlamaIndex 用户:Milvus、Chroma、Weaviate 支持完善
云厂商绑定:考虑对应云服务(如 Vertex AI)

2.ai常见使用情况

大多数在langchain和langchain4j场景有集成,方便使用。详情见:https://github.com/langchain4j/langchain4j-examples

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐