当前位置: 首页 > article >正文

ES批量查询

在 Elasticsearch 中,multi_search(也称为 msearch)是一种允许你在单个请求中执行多个搜索操作的 API。它可以显著减少网络开销,尤其是在需要执行多个查询时。multi_search 会将多个查询打包成一个请求发送给 Elasticsearch,然后返回多个查询的结果。


1. multi_search 的基本用法

multi_search 的请求格式如下:

  1. 请求头:指定索引名称(可选)和搜索参数。

  2. 请求体:每个查询由两部分组成:

    • 一个可选的 header 部分,用于指定索引、类型和搜索参数。

    • 一个 body 部分,用于指定查询 DSL。

示例

以下是一个 multi_search 的示例,包含两个查询:

json

复制

POST /_msearch
{}
{"index": "index1"}
{"query": {"match_all": {}}, "size": 10}
{}
{"index": "index2"}
{"query": {"match": {"field": "value"}}, "size": 5}
  • 第一个查询:在 index1 中执行 match_all 查询,返回最多10条文档。

  • 第二个查询:在 index2 中执行 match 查询,返回最多5条文档。


2. multi_search 的响应

multi_search 的响应是一个数组,数组中的每个元素对应一个查询的结果。例如:

json

复制

{
  "responses": [
    {
      "took": 10,
      "timed_out": false,
      "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
      },
      "hits": {
        "total": {
          "value": 100,
          "relation": "eq"
        },
        "max_score": 1.0,
        "hits": [
          {
            "_index": "index1",
            "_type": "_doc",
            "_id": "1",
            "_score": 1.0,
            "_source": {
              "field": "value1"
            }
          },
          ...
        ]
      }
    },
    {
      "took": 5,
      "timed_out": false,
      "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
      },
      "hits": {
        "total": {
          "value": 50,
          "relation": "eq"
        },
        "max_score": 1.5,
        "hits": [
          {
            "_index": "index2",
            "_type": "_doc",
            "_id": "2",
            "_score": 1.5,
            "_source": {
              "field": "value2"
            }
          },
          ...
        ]
      }
    }
  ]
}
  • responses:是一个数组,每个元素对应一个查询的结果。

  • 每个查询的结果与普通的 _search 请求返回的结果格式相同。


3. multi_search 的优势

  1. 减少网络开销

    • 将多个查询打包成一个请求,减少了客户端与 Elasticsearch 之间的网络往返次数。

    • 适合需要同时执行多个查询的场景。

  2. 提高性能

    • Elasticsearch 会并行处理 multi_search 中的查询,从而提高查询效率。

  3. 灵活性

    • 可以在一个请求中查询多个索引,甚至可以为每个查询指定不同的索引和参数。


4. multi_search 的使用场景

  1. 批量查询

    • 当需要同时执行多个查询时,可以使用 multi_search 来减少网络开销。

    • 例如,在前端页面中同时加载多个模块的数据。

  2. 多索引查询

    • 当需要从多个索引中查询数据时,可以使用 multi_search 来简化查询逻辑。

  3. 性能优化

    • 当需要优化查询性能时,可以将多个查询合并为一个 multi_search 请求。


5. 示例代码

以下是一个完整的 multi_search 示例,包含两个查询:

请求

json

复制

POST /_msearch
{}
{"index": "index1"}
{"query": {"match_all": {}}, "size": 10}
{}
{"index": "index2"}
{"query": {"match": {"field": "value"}}, "size": 5}

响应

json

复制

{
  "responses": [
    {
      "took": 10,
      "timed_out": false,
      "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
      },
      "hits": {
        "total": {
          "value": 100,
          "relation": "eq"
        },
        "max_score": 1.0,
        "hits": [
          {
            "_index": "index1",
            "_type": "_doc",
            "_id": "1",
            "_score": 1.0,
            "_source": {
              "field": "value1"
            }
          },
          ...
        ]
      }
    },
    {
      "took": 5,
      "timed_out": false,
      "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
      },
      "hits": {
        "total": {
          "value": 50,
          "relation": "eq"
        },
        "max_score": 1.5,
        "hits": [
          {
            "_index": "index2",
            "_type": "_doc",
            "_id": "2",
            "_score": 1.5,
            "_source": {
              "field": "value2"
            }
          },
          ...
        ]
      }
    }
  ]
}

6. 总结

  • multi_search 是一种高效的批量查询机制,适合同时执行多个查询。

  • 优势:减少网络开销、提高性能、支持多索引查询。

  • 使用场景:批量查询、多索引查询、性能优化。

通过合理使用 multi_search,可以显著提高查询效率,尤其是在需要执行多个查询的场景中。


http://www.kler.cn/a/567889.html

相关文章:

  • 大模型训练——pycharm连接实验室服务器
  • Python中文自然语言处理库SnowNLP
  • 多通道数据采集和信号生成的模块化仪器如何重构飞机电子可靠性测试体系?
  • 数据结构之各类排序算法代码及其详解
  • 判断按键盘是否好使的开机自启动PowerShell脚本
  • 【MATLAB例程】三维下的IMM(交互式多模型),模型使用CV(匀速)和CA(匀加速)
  • UWB人员定位:精准、高效、安全的智能管理解决方案
  • 使用3090显卡部署Wan2.1生成视频
  • 基于ai技术的视频生成工具
  • Java——String
  • 计算机网络之传输层(传输层提供的服务)
  • DeepSeek 开源狂欢周(五)正式收官|3FS并行文件系统榨干SSD
  • 【漫话机器学习系列】111.指数之和的对数(Log-Sum-Exp)
  • Flink同步数据mysql到doris问题合集
  • Ubuntu 下 nginx-1.24.0 源码分析 - ngx_init_cycle 函数 - 详解(5)
  • vue3-print-nb的使用,点击回调
  • 《深度揭秘:生成对抗网络如何重塑遥感图像分析精度》
  • PHP的学习
  • include 与 require 的区别及最佳使用场景
  • 如何正确理解mAP、精度、召回率等概念