当前位置：首页 > article >正文

ES批量查询

article 2025/3/4 8:10:50

在 Elasticsearch 中，multi_search（也称为 msearch）是一种允许你在单个请求中执行多个搜索操作的 API。它可以显著减少网络开销，尤其是在需要执行多个查询时。multi_search 会将多个查询打包成一个请求发送给 Elasticsearch，然后返回多个查询的结果。

1. `multi_search` 的基本用法

multi_search 的请求格式如下：

请求头：指定索引名称（可选）和搜索参数。
请求体：每个查询由两部分组成：
- 一个可选的 header 部分，用于指定索引、类型和搜索参数。
- 一个 body 部分，用于指定查询 DSL。

示例

以下是一个 multi_search 的示例，包含两个查询：

json

复制

POST /_msearch
{}
{"index": "index1"}
{"query": {"match_all": {}}, "size": 10}
{}
{"index": "index2"}
{"query": {"match": {"field": "value"}}, "size": 5}

第一个查询：在 index1 中执行 match_all 查询，返回最多10条文档。
第二个查询：在 index2 中执行 match 查询，返回最多5条文档。

2. `multi_search` 的响应

multi_search 的响应是一个数组，数组中的每个元素对应一个查询的结果。例如：

json

复制

{
  "responses": [
    {
      "took": 10,
      "timed_out": false,
      "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
      },
      "hits": {
        "total": {
          "value": 100,
          "relation": "eq"
        },
        "max_score": 1.0,
        "hits": [
          {
            "_index": "index1",
            "_type": "_doc",
            "_id": "1",
            "_score": 1.0,
            "_source": {
              "field": "value1"
            }
          },
          ...
        ]
      }
    },
    {
      "took": 5,
      "timed_out": false,
      "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
      },
      "hits": {
        "total": {
          "value": 50,
          "relation": "eq"
        },
        "max_score": 1.5,
        "hits": [
          {
            "_index": "index2",
            "_type": "_doc",
            "_id": "2",
            "_score": 1.5,
            "_source": {
              "field": "value2"
            }
          },
          ...
        ]
      }
    }
  ]
}

responses：是一个数组，每个元素对应一个查询的结果。
每个查询的结果与普通的 _search 请求返回的结果格式相同。

3. `multi_search` 的优势

减少网络开销：
- 将多个查询打包成一个请求，减少了客户端与 Elasticsearch 之间的网络往返次数。
- 适合需要同时执行多个查询的场景。
提高性能：
- Elasticsearch 会并行处理 multi_search 中的查询，从而提高查询效率。
灵活性：
- 可以在一个请求中查询多个索引，甚至可以为每个查询指定不同的索引和参数。

4. `multi_search` 的使用场景

批量查询：
- 当需要同时执行多个查询时，可以使用 multi_search 来减少网络开销。
- 例如，在前端页面中同时加载多个模块的数据。
多索引查询：
- 当需要从多个索引中查询数据时，可以使用 multi_search 来简化查询逻辑。
性能优化：
- 当需要优化查询性能时，可以将多个查询合并为一个 multi_search 请求。

5. 示例代码

以下是一个完整的 multi_search 示例，包含两个查询：

请求

json

复制

POST /_msearch
{}
{"index": "index1"}
{"query": {"match_all": {}}, "size": 10}
{}
{"index": "index2"}
{"query": {"match": {"field": "value"}}, "size": 5}

响应

json

复制

{
  "responses": [
    {
      "took": 10,
      "timed_out": false,
      "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
      },
      "hits": {
        "total": {
          "value": 100,
          "relation": "eq"
        },
        "max_score": 1.0,
        "hits": [
          {
            "_index": "index1",
            "_type": "_doc",
            "_id": "1",
            "_score": 1.0,
            "_source": {
              "field": "value1"
            }
          },
          ...
        ]
      }
    },
    {
      "took": 5,
      "timed_out": false,
      "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
      },
      "hits": {
        "total": {
          "value": 50,
          "relation": "eq"
        },
        "max_score": 1.5,
        "hits": [
          {
            "_index": "index2",
            "_type": "_doc",
            "_id": "2",
            "_score": 1.5,
            "_source": {
              "field": "value2"
            }
          },
          ...
        ]
      }
    }
  ]
}