Milvus Operator

向量数据库

开源

在 Kubernetes 上运行云原生向量数据库 Milvus

KubeBlocks Milvus Operator 支持 Standalone 与分布式 Cluster 两种部署模式，提供高性能 ANN 向量检索与标量过滤混合查询，是 RAG、语义搜索、推荐系统等 AI 应用的首选向量存储。

开源主页访问 GitHub

十亿+

向量规模支持

< 1ms

ANN 检索延迟

100%

开源免费

2 步部署生产级 Milvus Operator

安装 KubeBlocks

# 添加 Helm 仓库
helm repo add kubeblocks https://apecloud.github.io/helm-charts
helm repo update

# 安装 KubeBlocks
helm install kubeblocks kubeblocks/kubeblocks \
  --namespace kb-system --create-namespace

创建 Milvus Operator 集群

apiVersion: apps.kubeblocks.io/v1
kind: Cluster
metadata:
  name: milvus-cluster
  namespace: demo
spec:
  terminationPolicy: Delete
  clusterDef: milvus
  topology: standalone
  componentSpecs:
    - name: etcd
      replicas: 1
    - name: object-storage
      replicas: 1
    - name: milvus
      serviceVersion: "2.5.13"
      replicas: 1

核心能力

Standalone 与 Cluster 双模式

小规模场景用 Standalone 单机部署快速上线；亿级向量场景切换 Cluster 分布式模式，存算分离弹性扩展。

高性能 ANN 检索

支持 HNSW、IVF_FLAT、DISKANN 等多种索引，毫秒级返回 Top-K 近似最近邻结果。

标量与向量混合查询

支持在向量检索基础上叠加标量过滤条件（如时间、分类），精准匹配业务语义。

RAG 场景优化

与 LangChain、LlamaIndex 深度集成，是构建企业私有知识库与 RAG 问答系统的核心组件。

部署拓扑

Standalone 单机模式

所有 Coordinator 与 Worker 角色运行在单个 Milvus Pod 中，配套 etcd 与 S3 兼容对象存储作为元数据和对象存储，适合开发测试与小规模向量检索场景。

单 Pod 部署

开发/测试

快速上线

关键特性

单 Milvus Pod 内以 Goroutine 方式运行所有 Coordinator 与 Worker 角色

配套 etcd 与 S3 兼容对象存储保存元数据与向量数据

资源占用最小，快速上线验证

与分布式模式使用相同的 CRD API，可无缝切换

应用 / 客户端

Milvus SDK（Python / Go / Java / Node）· gRPC 或 REST
连接至 {cluster}-milvus:19530

gRPC :19530 / 指标 :9091

{cluster}-milvus

ClusterIP · :19530（gRPC）· :9091（指标/健康检查）
selector: 所有单机节点 Pod

ClusterIP

milvus-standalone-0单机节点

容器

milvus:19530（gRPC）· :9091（指标）

所有协调节点与工作节点角色均作为 goroutine 运行在单个 milvus 进程中

内嵌角色

Root 协调器

查询协调器

数据协调器

索引协调器

查询节点

数据节点

索引节点

代理节点

PVC data-0 · 本地段缓存 · 20Gi

元数据 + 对象存储 I/O

etcd-0

元数据 · 集合 Schema · 段信息

etcd:2379

PVC · 10Gi

object-storage-0

对象存储 · 向量 · 索引 · WAL

object-storage:9000

PVC · 20Gi

单机拓扑所有角色在单个进程中运行 · 适合开发和单节点部署

Milvus（单机节点）

存储组件（etcd / S3 兼容对象存储）

持久化存储

常见问题

KubeBlocks Milvus Operator 支持哪些 Milvus 版本？

KubeBlocks Milvus Operator 支持 Milvus 2.3、2.4、2.5 等主流版本。

Milvus Standalone 与 Cluster 模式如何选择？

Standalone 模式适合开发测试与千万级以下向量场景，资源占用少，上线快。Cluster 分布式模式适合亿级以上向量规模，支持独立扩展各计算组件，适合生产高可用场景。

KubeBlocks Milvus Operator 是否免费？

KubeBlocks 开源版完全开源免费。KubeBlocks 企业版提供图形化控制台与商业支持等增值功能。