连接至
{cluster}-milvus:19530selector: 所有单机节点 Pod
milvus 进程中KubeBlocks Milvus Operator 支持 Standalone 与分布式 Cluster 两种部署模式,提供高性能 ANN 向量检索与标量过滤混合查询,是 RAG、语义搜索、推荐系统等 AI 应用的首选向量存储。
十亿+
向量规模支持
< 1ms
ANN 检索延迟
100%
开源免费
2 步部署生产级 Milvus Operator
安装 KubeBlocks
# 添加 Helm 仓库 helm repo add kubeblocks https://apecloud.github.io/helm-charts helm repo update # 安装 KubeBlocks helm install kubeblocks kubeblocks/kubeblocks \ --namespace kb-system --create-namespace
创建 Milvus Operator 集群
apiVersion: apps.kubeblocks.io/v1
kind: Cluster
metadata:
name: milvus-cluster
namespace: demo
spec:
terminationPolicy: Delete
clusterDef: milvus
topology: standalone
componentSpecs:
- name: etcd
replicas: 1
- name: minio
replicas: 1
- name: milvus
serviceVersion: "2.5.13"
replicas: 1小规模场景用 Standalone 单机部署快速上线;亿级向量场景切换 Cluster 分布式模式,存算分离弹性扩展。
支持 HNSW、IVF_FLAT、DISKANN 等多种索引,毫秒级返回 Top-K 近似最近邻结果。
支持在向量检索基础上叠加标量过滤条件(如时间、分类),精准匹配业务语义。
与 LangChain、LlamaIndex 深度集成,是构建企业私有知识库与 RAG 问答系统的核心组件。
所有 Coordinator 与 Worker 角色运行在单个 Milvus Pod 中,配套 etcd 与 MinIO 作为元数据和对象存储,适合开发测试与小规模向量检索场景。
单 Milvus Pod 内以 Goroutine 方式运行所有 Coordinator 与 Worker 角色
配套 etcd 与 MinIO 存储元数据与向量数据
资源占用最小,快速上线验证
与分布式模式使用相同的 CRD API,可无缝切换
{cluster}-milvus:19530milvus 进程中KubeBlocks Milvus Operator 支持 Milvus 2.3、2.4、2.5 等主流版本。
Standalone 模式适合开发测试与千万级以下向量场景,资源占用少,上线快。Cluster 分布式模式适合亿级以上向量规模,支持独立扩展各计算组件,适合生产高可用场景。
KubeBlocks开源版完全开源免费。KubeBlocks企业版 提供图形化控制台与商业支持等增值功能。