当前位置：首页 > article >正文

浅谈Elasticsearch安全和权限管理

article 2025/1/19 3:32:27

Elasticsearch 安全和权限管理

Elasticsearch 是一个高度可扩展的开源全文搜索和分析引擎，它使得用户可以快速地存储、搜索和分析大量数据。在企业级应用中，保证数据的安全性和权限管理是至关重要的。本文将详细讲解 Elasticsearch 的安全和权限管理功能，包括身份验证、授权、加密和审计。

1. 身份验证

Elasticsearch 支持多种身份验证方式，包括基本身份验证、LDAP 身份验证、Active Directory 身份验证和 SAML 身份验证等。

1.1 基本身份验证

基本身份验证是最简单的身份验证方式，用户需要提供用户名和密码来访问 Elasticsearch。在 Elasticsearch 中，可以通过以下步骤配置基本身份验证：

在 elasticsearch.yml 配置文件中启用基本身份验证：

xpack.security.enabled: true
xpack.security.transport.ssl.enabled: true

使用内置的 elastic 用户创建其他用户和角色。例如，创建一个名为 my_admin 的用户，并为其分配 superuser 角色：
```
POST /_security/user/my_admin
{
  "password" : "mypassword",
  "roles" : [ "superuser" ],
  "full_name" : "My Admin"
}
```

使用创建的用户和密码访问 Elasticsearch：

curl -u my_admin:mypassword http://localhost:9200/_cluster/health

1.2 基于令牌的身份验证

基于令牌的身份验证允许用户使用访问令牌（access token）来访问 Elasticsearch。访问令牌是一个短期有效的字符串，可以通过用户名和密码获取。在 Elasticsearch 中，可以通过以下步骤配置基于令牌的身份验证：

获取访问令牌：

POST /_security/oauth2/token
{
  "grant_type" : "password",
  "username" : "my_admin",
  "password" : "mypassword"
}

返回的响应中包含访问令牌：

{
  "access_token": "AAEAAWVsYXN0aWNzZWFyY2gtdG9rZW4tZm9yLWV4YW1wbGU",
  "type": "Bearer",
  "expires_in": 1200
}

使用访问令牌访问 Elasticsearch：

curl -H "Authorization: Bearer AAEAAWVsYXN0aWNzZWFyY2gtdG9rZW4tZm9yLWV4YW1wbGU" http://localhost:9200/_cluster/health

1.3 基于证书的身份验证

基于证书的身份验证允许用户使用客户端证书来访问 Elasticsearch。在 Elasticsearch 中，可以通过以下步骤配置基于证书的身份验证：

在 elasticsearch.yml 配置文件中启用基于证书的身份验证：

xpack.security.http.ssl.enabled: true
xpack.security.http.ssl.client_authentication: required

配置客户端证书和私钥：

xpack.security.http.ssl.keystore.path: "http.p12"
xpack.security.http.ssl.truststore.path: "http.p12"

使用客户端证书访问 Elasticsearch：

curl --cert client.crt --key client.key https://localhost:9200/_cluster/health

1.4 LDAP 身份验证

LDAP 身份验证是一种常见的身份验证方式，它使用 LDAP 目录来存储用户信息和密码。在 Elasticsearch 中，可以通过配置 elasticsearch.yml 文件来启用 LDAP 身份验证，例如：

xpack.security.authc:
  realms:
    ldap:
      type: ldap
      order: 1
      url: "ldap://ldap.example.com:389"
      bind_dn: "cn=admin,dc=example,dc=com"
      bind_password: "password"
      user_search:
        base_dn: "ou=people,dc=example,dc=com"
        filter: "(uid={0})"

这里的 ldap 表示使用 LDAP 进行身份验证，url 表示 LDAP 服务器的地址和端口号，bind_dn 和 bind_password 表示 LDAP 管理员的用户名和密码，user_search 表示用户信息的搜索条件。

1.5 Active Directory 身份验证

Active Directory 身份验证是一种常见的身份验证方式，它使用 Active Directory 目录来存储用户信息和密码。在 Elasticsearch 中，可以通过配置 elasticsearch.yml 文件来启用 Active Directory 身份验证，例如：

xpack.security.authc:
  realms:
    ad:
      type: active_directory
      order: 2
      url: "ldap://ad.example.com:389"
      bind_dn: "cn=admin,dc=example,dc=com"
      bind_password: "password"
      user_search:
        base_dn: "ou=people,dc=example,dc=com"
        filter: "(sAMAccountName={0})"

这里的 ad 表示使用 Active Directory 进行身份验证，其他配置项与 LDAP 身份验证类似。

1.6 SAML 身份验证

SAML 身份验证是一种基于标准的身份验证方式，它使用 SAML 协议来实现身份验证。在 Elasticsearch 中，可以通过配置 elasticsearch.yml 文件来启用 SAML 身份验证，例如：

xpack.security.authc:
  realms:
    saml:
      type: saml
      order: 3
      idp:
        metadata_path: "/path/to/idp-metadata.xml"
      sp:
        entity_id: "https://elasticsearch.example.com"
        acs: "https://elasticsearch.example.com/api/security/v1/saml"

这里的 saml 表示使用 SAML 进行身份验证，idp 表示身份提供者的元数据路径，sp 表示服务提供者的实体 ID 和断言消费服务的 URL。

1.7 结合 LDAP 或 Active Directory 进行身份验证

Elasticsearch 还支持与 LDAP（轻量级目录访问协议）或 Active Directory（AD）集成，以便在企业环境中进行集中式身份验证。要配置 LDAP 或 AD 集成，请按照以下步骤操作：

在 elasticsearch.yml 配置文件中启用 LDAP 或 AD 集成：

xpack.security.authc.realms:
  ldap1:
    type: ldap
    order: 0
    url: "ldaps://ldap.example.com:636"
    bind_dn: "cn=admin,dc=example,dc=com"
    bind_password: "password"
    user_search:
      base_dn: "ou=users,dc=example,dc=com"
      filter: "(uid={0})"
    group_search:
      base_dn: "ou=groups,dc=example,dc=com"
    files:
      role_mapping: "role_mapping.yml"
    unmapped_groups_as_roles: false

对于 Active Directory，配置如下：

xpack.security.authc.realms:
  active_directory:
    type: active_directory
    order: 0
    domain_name: "example.com"
    url: "ldaps://ad.example.com:636"
    bind_dn: "cn=admin,dc=example,dc=com"
    bind_password: "password"
    files:
      role_mapping: "role_mapping.yml"
    unmapped_groups_as_roles: false

在 role_mapping.yml 文件中配置用户和角色的映射关系。例如，将 LDAP 中的 cn=admins,ou=groups,dc=example,dc=com 组映射到 Elasticsearch 的 superuser 角色：
```
superuser:
  - "cn=admins,ou=groups,dc=example,dc=com"
```
重启 Elasticsearch 以应用更改。

现在，Elasticsearch 将使用 LDAP 或 Active Directory 进行身份验证。用户可以使用其 LDAP 或 AD 凭据访问 Elasticsearch。

总之，Elasticsearch 提供了多种身份验证方式，包括基于用户名和密码的基本身份验证、基于令牌的身份验证、基于证书的身份验证以及与 LDAP 或 Active Directory 的集成。通过正确配置这些功能，可以确保 Elasticsearch 系统的安全性和满足企业级应用的需求。

2. 授权

授权是确定用户可以访问哪些资源和执行哪些操作的过程。在 Elasticsearch 中，可以通过角色和权限来实现授权。

2.1 角色和权限

在 Elasticsearch 中，角色是一组权限的集合，权限是一组允许或拒绝执行特定操作的规则。角色可以分配给用户，以便控制用户可以访问的资源和执行的操作。

Elasticsearch 提供了一些预定义的角色，例如：

superuser：具有所有权限的用户，可以执行任何操作。
kibana_admin：具有管理 Kibana 的权限，可以创建和管理仪表板、可视化等。
monitoring_user：具有访问监控数据的权限，可以查看 Elasticsearch 集群的性能和状态。

2.2 创建自定义角色

除了预定义的角色外，还可以创建自定义角色。例如，创建一个名为 read_only 的角色，只允许用户读取索引中的数据：

PUT /_security/role/read_only
{
  "indices": [
    {
      "names": [ "*" ],
      "privileges": [ "read" ]
    }
  ]
}

创建一个名为 index_manager 的角色，允许用户创建和删除索引，但不能对数据进行读写操作：

PUT /_security/role/index_manager
{
  "indices": [
    {
      "names": [ "*" ],
      "privileges": [ "create_index", "delete_index" ]
    }
  ]
}

2.3 分配角色给用户

创建角色后，可以将其分配给用户。例如，将 read_only 角色分配给名为 my_user 的用户：

POST /_security/user/my_user
{
  "password" : "mypassword",
  "roles" : [ "read_only" ],
  "full_name" : "My User"
}

现在，my_user 只能读取索引中的数据，无法执行其他操作，如创建或删除索引。

2.4 使用角色模板

角色模板是一种动态生成角色的方法，可以根据用户的属性来生成角色。例如，创建一个名为 user_specific_index 的角色模板，允许用户访问其用户名作为前缀的索引：

PUT /_security/role/user_specific_index
{
  "indices": [
    {
      "names": [ "{user.name}_*" ],
      "privileges": [ "read", "write" ]
    }
  ]
}

现在，名为 john 的用户可以访问 john_* 索引，而名为 jane 的用户可以访问 jane_* 索引。

2.5 使用 API 键进行授权

API 键是一种用于授权的机制，允许用户使用 API 键来访问 Elasticsearch，而无需提供用户名和密码。API 键可以具有与用户相同或更少的权限。要创建 API 键，请执行以下操作：

POST /_security/api_key
{
  "name": "my_api_key",
  "role_descriptors": {
    "read_only": {
      "indices": [
        {
          "names": [ "*" ],
          "privileges": [ "read" ]
        }
      ]
    }
  }
}

返回的响应中包含 API 键：

{
  "id" : "VuaCfGcBCdbkQmijuKPS",
  "name" : "my_api_key",
  "api_key" : "ui2lp2axTNmsyakw9tvNnw"
}

使用 API 键访问 Elasticsearch：

curl -H "Authorization: ApiKey VuaCfGcBCdbkQmijuKPS:ui2lp2axTNmsyakw9tvNnw" http://localhost:9200/_cluster/health

现在，用户可以使用 API 键来访问 Elasticsearch，而无需提供用户名和密码。请注意，API 键具有与创建它的用户相同或更少的权限。

2.6 集成第三方身份提供商进行授权

Elasticsearch 还支持与第三方身份提供商（如 SAML、OpenID Connect 等）集成，以便在企业环境中进行集中式授权。要配置第三方身份提供商集成，请按照以下步骤操作：

在 elasticsearch.yml 配置文件中启用第三方身份提供商集成。以 SAML 为例：

xpack.security.authc.token.enabled: true
xpack.security.authc.realms.saml1:
  type: saml
  order: 2
  idp.metadata.path: "https://idp.example.com/metadata"
  idp.entity_id: "https://idp.example.com/metadata"
  sp.entity_id:  "https://sp.example.com/metadata"
  sp.acs: "https://sp.example.com/acs"
  sp.logout: "https://sp.example.com/logout"
  attributes.principal: "nameid:persistent"
  attributes.groups: "groups"

在 Kibana 中配置 SAML 集成：

xpack.security.authc.providers:
  saml.saml1:
    order: 0
    realm: "saml1"

重启 Elasticsearch 和 Kibana 以应用更改。

现在，Elasticsearch 将使用第三方身份提供商进行授权。用户可以使用其 SAML 凭据访问 Elasticsearch。

2.7 访问控制

基于角色的访问控制（RBAC）是一种授权策略，通过将权限分配给角色，然后将角色分配给用户来实现。在 Elasticsearch 中，可以使用 RBAC 来控制用户对索引、文档和字段的访问权限。

2.7.1 索引级别的访问控制

在 Elasticsearch 中，可以为角色分配特定索引的访问权限。例如，创建一个名为 logs_read 的角色，只允许用户读取名为 logs-* 的索引：

PUT /_security/role/logs_read
{
  "indices": [
    {
      "names": [ "logs-*" ],
      "privileges": [ "read" ]
    }
  ]
}

将 logs_read 角色分配给名为 log_viewer 的用户：

POST /_security/user/log_viewer
{
  "password" : "mypassword",
  "roles" : [ "logs_read" ],
  "full_name" : "Log Viewer"
}

现在，log_viewer 用户只能读取 logs-* 索引，无法访问其他索引。

配置 elasticsearch.yml 文件方式：

xpack.security.authz:
  roles:
    admin:
      cluster:
        - all
      indices:
        - names: '*'
          privileges:
            - all
    user:
      cluster:
        - monitor
      indices:
        - names: 'logs-*'
          privileges:
            - read

这里的 admin 和 user 表示角色名称，cluster 表示集群级别的权限，indices 表示索引级别的权限。在定义完角色和权限后，可以将用户分配到不同的角色，例如：

POST /_security/user/john/_roles
{
  "roles": ["admin"]
}

这里的 john 表示用户名，admin 表示要分配的角色名称。

2.7.2 字段级别的访问控制 (Field-Level Security, FLS)

字段级别的访问控制（FLS）允许您限制用户访问文档中特定字段的权限。例如，创建一个名为 logs_read_sensitive 的角色，只允许用户读取 logs-* 索引中的 timestamp 和 message 字段：

PUT /_security/role/logs_read_sensitive
{
  "indices": [
    {
      "names": [ "logs-*" ],
      "privileges": [ "read" ],
      "field_security" : {
        "grant" : [ "timestamp", "message" ]
      }
    }
  ]
}

将 logs_read_sensitive 角色分配给名为 sensitive_log_viewer 的用户：

POST /_security/user/sensitive_log_viewer
{
  "password" : "mypassword",
  "roles" : [ "logs_read_sensitive" ],
  "full_name" : "Sensitive Log Viewer"
}

现在，sensitive_log_viewer 用户只能访问 logs-* 索引中的 timestamp 和 message 字段，无法访问其他字段。

配置 elasticsearch.yml 文件方式：

xpack.security.field_level_security:
  enabled: true
  grant:
    - field: "user"
      value: "john"
      except: ["password"]

这里的 enabled 表示是否启用字段级别的访问控制，grant 表示允许访问的字段和值。在定义完字段级别的访问控制后，可以将其应用到索引中，例如：

PUT /logs
{
  "mappings": {
    "properties": {
      "user": {
        "type": "text",
        "fielddata": true,
        "fields": {
          "keyword": {
            "type": "keyword"
          }
        }
      },
      "password": {
        "type": "text",
        "fielddata": true,
        "fields": {
          "keyword": {
            "type": "keyword"
          }
        }
      }
    }
  },
  "settings": {
    "index": {
      "query": {
        "default_field": "user"
      },
      "security": {
        "field_level_security": {
          "grant": [
            {
              "field": "user",
              "value": "john",
              "except": ["password"]
            }
          ]
        }
      }
    }
  }
}

这里的 logs 表示索引名称，user 和 password 表示字段名称。在定义完索引后，可以使用查询 DSL 来访问索引中的数据，例如：

GET /logs/_search
{
  "query": {
    "match": {
      "user": "john"
    }
  }
}

2.7.3 文档级别的访问控制 (Document-Level Security, DLS)

文档级别的访问控制（DLS）允许您限制用户访问特定文档的权限。例如，创建一个名为 logs_read_team1 的角色，只允许用户读取 logs-* 索引中 team 字段值为 team1 的文档：

PUT /_security/role/logs_read_team1
{
  "indices": [
    {
      "names": [ "logs-*" ],
      "privileges": [ "read" ],
      "query": {
        "term": { "team": "team1" }
      }
    }
  ]
}

将 logs_read_team1 角色分配给名为 team1_log_viewer 的用户：

POST /_security/user/team1_log_viewer
{
  "password" : "mypassword",
  "roles" : [ "logs_read_team1" ],
  "full_name" : "Team1 Log Viewer"
}

现在，team1_log_viewer 用户只能访问 logs-* 索引中 team 字段值为 team1 的文档，无法访问其他文档。

2.7.4 IP 白名单

您可以通过配置 Elasticsearch 的网络层来限制哪些 IP 地址可以访问 Elasticsearch。这可以通过在 elasticsearch.yml 配置文件中设置 http.host 和 http.publish_host 参数来实现。

例如，只允许来自 IP 地址 192.168.1.100 的请求访问 Elasticsearch：

http.host: 192.168.1.100
http.publish_host: 192.168.1.100

请注意，这种方法只限制了哪些 IP 地址可以访问 Elasticsearch，而不限制用户可以执行的操作。因此，建议将 IP 白名单与其他访问控制方法（如基于角色的访问控制）结合使用。

2.7.5 匿名访问

Elasticsearch 支持配置匿名访问，允许未经身份验证的用户访问 Elasticsearch。匿名用户将被分配一个或多个预定义的角色，以限制其访问权限。

要启用匿名访问，请在 elasticsearch.yml 配置文件中添加以下配置：

xpack.security.authc:
  anonymous:
    username: _anonymous
    roles: read_only
    authz_exception: true

在此示例中，匿名用户将被分配 read_only 角色，只能读取索引中的数据。请注意，启用匿名访问可能会导致安全风险，因此请谨慎使用。

2.7.6 跨集群复制 (Cross-Cluster Replication, CCR)

跨集群复制（CCR）是一种在多个 Elasticsearch 集群之间同步数据的方法。通过 CCR，您可以将数据从一个集群（称为领导者集群）复制到另一个集群（称为追随者集群）。这可以用于实现地理冗余、负载均衡和数据访问控制。

在 CCR 中，您可以为追随者集群中的用户分配不同的角色和权限，以限制其对领导者集群中的数据的访问。例如，您可以允许追随者集群中的用户只读取特定索引，而不允许他们修改数据或访问其他索引。

要配置 CCR，请按照以下步骤操作：

在领导者集群和追随者集群中启用 CCR：

xpack.security.enabled: true
xpack.ccr.enabled: true

在追随者集群中创建一个远程集群连接，指向领导者集群：
```
cluster.remote.leader_cluster:
  seeds: ["leader_cluster_ip:9300"]
```

在追随者集群中创建一个跟随索引，以复制领导者集群中的数据：

PUT /follower_index/_ccr/follow
{
  "remote_cluster": "leader_cluster",
  "leader_index": "leader_index"
}

为追随者集群中的用户分配角色和权限，以限制其对领导者集群中的数据的访问。

总之，Elasticsearch 提供了多种访问控制功能，包括基于角色的访问控制、字段级别的访问控制和文档级别的访问控制。通过正确配置这些功能，可以确保 Elasticsearch 系统的安全性和满足企业级应用的需求。

3. 加密

为了保护数据的安全和隐私，Elasticsearch 提供了多种加密功能，包括传输层安全（TLS）和数据加密。

3.1 传输层安全（TLS）

传输层安全（TLS）是一种加密协议，用于在网络上保护数据的传输。在 Elasticsearch 中，可以通过以下步骤启用 TLS：

生成证书和私钥，可以使用 Elasticsearch 的 elasticsearch-certutil 工具生成自签名证书。

在 elasticsearch.yml 配置文件中启用 TLS：

xpack.security.transport.ssl.enabled: true
xpack.security.transport.ssl.verification_mode: certificate
xpack.security.transport.ssl.keystore.path: "elastic-certificates.p12"
xpack.security.transport.ssl.truststore.path: "elastic-certificates.p12"

重启 Elasticsearch 以应用更改。

3.2 数据加密

3.2.1 磁盘加密

Elasticsearch 本身不提供数据加密功能。但是，你可以使用文件系统级别的加密来保护 Elasticsearch 存储的数据。以下是一些建议：

使用文件系统级别的加密，如 dm-crypt（Linux）、BitLocker（Windows）或 FileVault（macOS）。这些工具可以对 Elasticsearch 数据存储的文件进行加密，从而保护数据的安全。
使用硬件加密，如自加密硬盘（Self-Encrypting Drives，SEDs）。这些硬盘具有内置的加密功能，可以在硬件级别对数据进行加密，提供更高的安全性和性能。

3.2.2 快照加密

Elasticsearch 支持创建快照以备份数据。为了保护快照中的数据，可以使用以下方法对快照进行加密：

使用加密的存储服务，如 Amazon S3 或 Google Cloud Storage。这些服务提供了服务器端加密（Server-Side Encryption，SSE）功能，可以自动对存储的数据进行加密。
使用客户端加密库，如 Amazon S3 Encryption Client 或 Google Cloud Storage Client Libraries。这些库提供了客户端加密（Client-Side Encryption，CSE）功能，可以在上传数据到存储服务之前对数据进行加密。

3.2.3 数据脱敏

数据脱敏是一种数据保护技术，通过对敏感数据进行处理，使其无法识别特定个人，同时保留数据的可用性。在 Elasticsearch 中，可以使用以下方法对数据进行脱敏：

使用 Ingest Node 处理数据。Ingest Node 是 Elasticsearch 的一个功能，可以在数据索引之前对数据进行预处理。你可以使用 Ingest Pipelines 和 Processors 对敏感数据进行脱敏处理，如删除、替换或哈希。
使用 Logstash 处理数据。Logstash 是一个数据处理管道，可以从多种来源获取数据，对数据进行处理，然后将数据发送到 Elasticsearch。你可以使用 Logstash 的 Filters 对敏感数据进行脱敏处理，如删除、替换或哈希。