当前位置: 首页 > article >正文

基于 Elasticsearch 和 Milvus 的 RAG 运维知识库的架构设计和部署落地实现指南

最近在整理一些业务场景的架构设计和部署落地实现指南
先放一个 【基于RAG的运维知识库 (ElasticSearch + Milvus) 的详细实现指南】,其中包含了详尽的技术实现细节、可运行的示例代码、原理分析、优缺点分析和应用场景分析。

架构描述: 基于RAG的运维知识库 (ElasticSearch + Milvus)

部署指南

1. 极其详细的部署步骤 (包含详尽的技术实现细节和分步骤、可运行的示例代码-也只能给示例代码)

1.1 环境准备
  • 操作系统选择: 推荐使用 Linux 发行版,如 CentOS 7/8、Ubuntu 18.04/20.04。本指南以 CentOS 7 为例。

  • 网络环境配置: 确保服务器之间网络互通,防火墙开放 Elasticsearch (默认端口 9200)、Milvus (默认端口 19530) 和应用程序所需的端口。

  • 安装必要软件包:

    # 更新 yum 源
    sudo yum update -y
    
    # 安装常用工具
    sudo yum install -y wget curl vim net-tools
    
    # 安装 Java (Elasticsearch 依赖)
    sudo yum install -y java-1.8.0-openjdk-devel
    
    # 安装 Python (用于后续脚本)
    sudo yum install -y python3 python3-pip
    
    # 安装 Docker 和 Docker Compose (可选,用于容器化部署)
    sudo yum install -y yum-utils
    sudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo
    sudo yum install -y docker-ce docker-ce-cli containerd.io
    sudo systemctl start docker
    sudo systemctl enable docker
    sudo curl -L "https://github.com/docker/compose/releases/download/1.29.2/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
    sudo chmod +x /usr/local/bin/docker-compose
    
  • 配置环境变量:

    # 编辑 /etc/profile 或 ~/.bashrc
    # 添加以下内容 (根据实际安装路径修改)
    export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk
    export PATH=$JAVA_HOME/bin:$PATH
    
    # 使环境变量生效
    source /etc/profile  # 或 source ~/.bashrc
    
1.2 组件安装配置
1.2.1 Elasticsearch 安装配置
  1. 下载 Elasticsearch:

    wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.17.17-linux-x86_64.tar.gz  # 根据需要选择版本
    tar -xzf elasticsearch-7.17.17-linux-x86_64.tar.gz
    cd elasticsearch-7.17.17/
    
  2. 修改配置文件 config/elasticsearch.yml

    cluster.name: my-rag-cluster  # 集群名称
    node.name: node-1  # 节点名称
    network.host: 0.0.0.0  # 监听所有 IP 地址
    http.port: 9200  # Elasticsearch 端口
    discovery.seed_hosts: ["node-1"]  #  单节点部署,配置为节点名称
    cluster.initial_master_nodes: ["node-1"]  # 单节点部署
    # 建议配置 (根据实际情况调整):
    # bootstrap.memory_lock: true  # 锁定内存,防止交换
    # xpack.security.enabled: false  # 如果不需要安全认证,可以禁用
    # 注意:以上只是示例配置,生产环境请务必根据实际情况进行详细配置,特别是安全相关的配置。
    

    关键参数解释:

    • cluster.name: 集群名称,同一集群内的节点应具有相同的集群名称。
    • node.name: 节点名称,用于标识集群中的单个节点。
    • network.host: Elasticsearch 监听的 IP 地址,0.0.0.0 表示监听所有 IP。
    • http.port: Elasticsearch 的 HTTP 端口,默认为 9200。
    • discovery.seed_hosts: 集群发现的主机列表。在单节点部署中,可以设置为节点名称。
    • cluster.initial_master_nodes: 初始主节点列表。在单节点部署中,设置为节点名称。
    • bootstrap.memory_lock: 是否锁定内存,防止 Elasticsearch 内存被交换到磁盘,影响性能。
    • xpack.security.enabled:开启xpack security功能。
  3. 启动 Elasticsearch:

    ./bin/elasticsearch -d  # 后台启动
    
  4. 验证 Elasticsearch:

    curl http://localhost:9200/
    

    如果返回 JSON 格式的 Elasticsearch 信息,则表示启动成功。

1.2.2 Milvus 安装配置
  1. 使用 Docker Compose 安装 Milvus (推荐):

    # 创建 docker-compose.yml 文件
    cat > docker-compose.yml <<EOF
    version: '3.5'
    services:
      etcd:
        container_name: milvus-etcd
        image: milvusdb/etcd:v3.5.5
        environment:
          ETCD_USE_EMBEDDED: "true"
        volumes:
          - ${DOCKER_VOLUME_DIRECTORY:-.}/volumes/etcd:/etcd
      standalone:
        container_name: milvus-standalone
        image: milvusdb/milvus:v2.2.14 # 根据需要选择版本
        command: ["milvus", "run", "standalone"]
        environment:
          ETCD_ENDPOINTS: etcd:2379
          MINIO_ADDRESS: minio:9000
        volumes:
          - ${DOCKER_VOLUME_DIRECTORY:-.}/volumes/milvus:/var/lib/milvus
        ports:
          - "19530:19530"
          - "9091:9091"
        depends_on:
          - "etcd"
      minio:
        container_name: milvus-minio
        image: minio/minio:RELEASE.2022-10-29T06-21-33Z
        environment:
          MINIO_ACCESS_KEY: minioadmin
          MINIO_SECRET_KEY: minioadmin
        volumes:
          - ${DOCKER_VOLUME_DIRECTORY:-.}/volumes/minio:/minio_data
        ports:
          - "9000:9000"
          - "9001:9001"
        command: minio server /minio_data --console-address ":9001"
        depends_on:
          - "etcd"
    networks:
      default:
        name: milvus
    EOF
    
    # 启动 Milvus
    docker-compose up -d
    

关键配置参数解释

  • milvus-etcd: etcd镜像,用于存储milvus的元数据。
  • milvus-standalone: Milvus的standalone模式镜像。
    • ETCD_ENDPOINTS: etcd 的连接地址。
    • MINIO_ADDRESS: MinIO 的连接地址,用于存储数据。
  • milvus-minio: 对象存储minIO镜像。
    • MINIO_ACCESS_KEY:MinIO用户名
    • MINIO_SECRET_KEY:MinIO密码
  1. 验证 Milvus:

    docker ps  # 查看 Milvus 容器是否正常运行
    
1.2.3 安装 Python 依赖
pip3 install pymilvus==2.2.14 elasticsearch==7.17.1 # 注意版本匹配
pip3 install sentence-transformers
1.3 组件集成 (RAG 应用程序)

以下是一个 Python 代码示例,展示如何使用 Elasticsearch 和 Milvus 实现 RAG:

from elasticsearch import Elasticsearch
from pymilvus import connections, FieldSchema, CollectionSchema, DataType, Collection, utility
from sentence_transformers import SentenceTransformer

# --- 1. 连接到 Elasticsearch 和 Milvus ---

es = Elasticsearch(
    hosts=["http://localhost:9200"],  # Elasticsearch 地址
    # 如果 Elasticsearch 启用了安全认证,需要提供用户名和密码
    # http_auth=("elastic", "your_password")
)

connections.connect(
    alias="default",
    host="localhost",  # Milvus 地址
    port="19530"
)

# --- 2. 定义 Elasticsearch 索引和 Milvus Collection ---

# Elasticsearch 索引
index_name = "operations_knowledge"
if not es.indices.exists(index=index_name):
    es.indices.create(
        index=index_name,
        body

http://www.kler.cn/a/570662.html

相关文章:

  • 深入剖析Java NIO的epoll机制:红黑树、触发模式与CPU缓存优化
  • 运动想象 (MI) 分类学习系列 (17) : CCSM-FT
  • OCR PDF 文件是什么?它包含什么内容?
  • 力扣 最长回文子串
  • M4 Mac mini运行DeepSeek-R1模型
  • 03.03 QT
  • 如何本地部署大模型及性能优化指南(附避坑要点)
  • AI预测福彩3D新模型百十个定位预测+胆码预测+杀和尾+杀和值2025年3月3日第11弹
  • WordPress ltl-freight-quotes-estes-edition sql注入漏洞(CVE-2024-13479)
  • Linux虚拟机网络配置-桥接网络配置
  • 【向量数据库Weaviate】与ChromaDB的差异、优劣
  • 刚安装docker并启动docker服务: systemctl restart docker报错解决
  • [RN]React Native知识框架图详解
  • Golang的图形用户界面设计
  • python爬虫Scapy框架(1)
  • 分布式中间件:Redis介绍
  • 蓝桥杯 - 每日打卡(类斐波那契循环数)
  • 国产编辑器EverEdit - 超多样式设置
  • 深入解析 Rust 异步编程中的 Traits
  • 计算机毕业设计SpringBoot+Vue.js医院后台管理系统(源码+文档+PPT+讲解)