当前位置：首页 > article >正文

ELK(Elasticsearch、Logstash、Kbana)安装及Spring应用

article 2025/3/16 16:50:43

Elasticsearch安装及Spring应用

一、引言
二、基本概念
- 1.索引（Index）
- 2.类型（Type）
- 3.文档（Document）
- 4.分片（Shard）
- 5.副本（Replica）
二、ELK搭建
- 1.创建挂载的文件
- 2.创建配置文件
- 3.运行容器
- - 1. docker compose一键搭建
  - 2.单独运行
三、项目集成
版本注意

一、引言

Elasticsearch 是一个开源的分布式搜索和分析引擎，基于 Apache Lucene 构建。它提供了一个分布式、多租户的全文搜索引擎，具有高可用性、可扩展性和高性能等特点。Elasticsearch 广泛应用于日志分析、全文搜索、商业智能等领域。

二、基本概念

1.索引（Index）

定义：索引是 Elasticsearch 中存储数据的逻辑容器，类似于关系型数据库中的数据库。一个索引可以包含多个文档，并且可以在多个节点上进行分片存储。
示例：假设我们要构建一个电商平台的搜索系统，可以创建一个名为 products 的索引来存储所有商品信息。

2.类型（Type）

定义：在 Elasticsearch 7.x 及以前的版本中，类型是索引内部的逻辑分区，类似于关系型数据库中的表。但从 Elasticsearch 8.x 开始，类型已被弃用，一个索引中只能有一个 “_doc” 类型。
历史示例（7.x 及以前）：在 products 索引中，可以定义 clothes、electronics 等不同类型来区分不同类别的商品。

3.文档（Document）

定义：文档是 Elasticsearch 中存储的基本数据单元，类似于关系型数据库中的一行记录。文档以 JSON 格式表示，包含一个或多个字段。
示例：一个商品文档可能如下所示：

{
    "id": 1,
    "name": "iPhone 15",
    "price": 999,
    "category": "electronics"
}

4.分片（Shard）

定义：为了实现分布式存储和处理，索引会被划分为多个分片。每个分片是一个独立的 Lucene 索引，可以存储部分文档数据。分片可以分布在不同的节点上，提高系统的可扩展性和容错性。
示例：如果我们将 products 索引划分为 5 个分片，那么每个分片将存储一部分商品文档。

5.副本（Replica）

定义：副本是分片的复制，用于提高数据的可用性和容错性。每个分片可以有零个或多个副本，副本会分布在不同的节点上。当某个节点出现故障时，副本可以接替该节点上的分片继续提供服务。
示例：如果我们为 products 索引的每个分片设置 1 个副本，那么总共会有 10 个分片（5 个主分片和 5 个副本分片）。

二、ELK搭建

ELK分别是Elasticsearch、Logstash、Kibana

Elasticsearch:存储大量日志，并为其创建索引，提供查询。
Logstash：负责从应用，也就是我们的程序的日志采集、处理加工数据给Elasticsearch
Kbana：从Elasticsearch搜索日志，并展示到页面，供用户使用。

1.创建挂载的文件

es挂载：

mkdir -p /usr/docker/elk/elasticsearch/{config,plugins,data,logs}

kibana挂载：

mkdir -p /usr/docker/elk/kibana/config

logstash挂载：

mkdir -p /usr/docker/elk/logstash/config

2.创建配置文件

ES挂载具体配置

vim /usr/docker/elk/elasticsearch/config/elasticsearch.yml
#输入下面命令：
http.host: 0.0.0.0
xpack.security.enabled: false

http.host：任何地址都可以访问。
xpack.security.enabled：关闭密码认证

Kibana挂载具体配置

vim /usr/docker/elk/kibana/config/kibana.yml
# 内容
server.host: "0.0.0.0" 
elasticsearch.url: "http://192.168.1.37:9200"  # 注意7.X以上版本用elasticsearch.hosts: ["http://192.168.1.37:9200"]
xpack.security.enabled: false

elasticsearch.hosts：指向es地址

Logstash挂载具体配置

vim /usr/docker/elk/logstash/config/logstash.yml
#内容：
http.host: "0.0.0.0"
xpack.monitoring.elasticsearch.url: http://192.168.1.37:9200# 注意7.X以上版本用elasticsearch.hosts: ["http://192.168.1.37:9200"]

#记录存放：
cd  /usr/docker/elk/logstash/config
touch  log
chmod 777 log

配置mysql

vim /usr/docker/elk/logstash/config/logstash.conf

input {
    stdin {
    }
    jdbc {
      jdbc_connection_string => "jdbc:mysql://192.168.1.103:3306/wpx_resource?characterEncoding=utf8&zeroDateTimeBehavior=convertToNull&useSSL=false&serverTimezone=Asia/Shanghai&nullCatalogMeansCurrent=true&allowPublicKeyRetrieval=true"
      jdbc_user => "root"
      jdbc_password => "Abc123!_"
      jdbc_driver_library => "/usr/share/logstash/config/mysql-connector-java-8.0.18.jar"
      jdbc_driver_class => "com.mysql.cj.jdbc.Driver"
      jdbc_paging_enabled => "true"
      jdbc_page_size => "3000"
      # 将 create_date 转换为时间戳
      statement => "SELECT resources_id, resources_name, resources_type, resources_size, resource_suffix, out_path, local_path, video_id, duration, all_parent_ids, parent_resource_id, parent_public_directory_ids, UNIX_TIMESTAMP(create_date) as create_date_timestamp, modify_date, create_by_id, create_by, modify_by_id, modify_by, is_share, is_public, tenant_id, download_num, public_resource_id, review_result, review_state, del_flag FROM resource_manage"
      schedule => "*/1 * * * *"
      use_column_value => false
      tracking_column_type => "timestamp"
      # 使用转换后的字段名
      tracking_column => "create_date_timestamp"
      record_last_run => true
      jdbc_default_timezone => "Asia/Shanghai"
      last_run_metadata_path => "/usr/share/logstash/config/log"
    }
}

output {
    elasticsearch {
        hosts => ["192.168.1.37:9200"]
        index => "resource_manage"
        document_id => "%{resources_id}"
    }
    stdout {
        codec => json_lines
    }
}

数据库连接配置：

jdbc_connection_string：指定要连接的 MySQL 数据库的连接字符串，包括数据库的地址（192.168.239.131）、端口（3306）、数据库名（test）以及一些连接参数（如字符编码和时区）。
jdbc_user 和 jdbc_password：分别是连接数据库的用户名和密码。
jdbc_driver_library：指定 MySQL JDBC 驱动的 JAR 文件路径。
jdbc_driver_class：指定 JDBC 驱动类的名称。

分页配置：

jdbc_paging_enabled：启用分页查询，设置为 true 表示开启分页功能。
jdbc_page_size：每次查询的记录数，这里设置为 300000。

查询配置：

statement：定义要执行的 SQL 查询语句，这里是从 sys_log 表中查询指定的列。

定时任务配置：

schedule：使用 cron 表达式指定查询的执行频率，*/1 * * * * 表示每分钟执行一次查询。

增量查询配置：

use_column_value：是否使用列的值来跟踪数据，这里设置为 false。
tracking_column_type：跟踪列的数据类型，这里是 timestamp 类型。
tracking_column：指定用于跟踪数据的列名，这里是 oper_time 列。
record_last_run：是否记录上次查询的时间，设置为 true 表示记录。
last_run_metadata_path：指定记录上次查询时间的文件路径。

时区配置：

jdbc_default_timezone：指定数据库的默认时区为 Asia/Shanghai。

注意需要自己下载mysql-connector-java-8.0.28.jar或者将本地的拷贝到挂载的logstash/config中

流水线指定上面的配置文件

vim /mydata/elk/logstash/config/pipelines.yml
#内容：

- pipeline.id: resource_manage
  path.config: "/usr/share/logstash/config/logstash.conf"

最后/usr/docker/elk/logstash/config目录如下
在这里插入图片描述
防止保存没有修改权限，可以把上面建的文件夹和文件赋予修改权限：

chmod 777 文件名称

注意如果是6版本需要配置log4j2.properties文件

cd /usr/docker/elk/logstash/config
vim log4j2.properties
#添加内容
status = error
name = LogstashPropertiesConfig

#filename = /usr/share/logstash/logs

appender.rolling.type = RollingFile
appender.rolling.name = RollingFile
appender.rolling.fileName = logs/logstash.log
appender.rolling.filePattern = logs/logstash-%d{yyyy-MM-dd}-%i.log.gz
appender.rolling.layout.type = PatternLayout
appender.rolling.layout.pattern = [%d{ISO8601}][%-5p][%-25c] %m%n
appender.rolling.policies.type = Policies
appender.rolling.policies.time.type = TimeBasedTriggeringPolicy
appender.rolling.policies.time.interval = 1
appender.rolling.policies.time.modulate = true
#appender.rolling.policies.size.type = SizeBasedTriggeringPolicy
#appender.rolling.policies.size.size=50MB
#appender.rolling.strategy.type = DefaultRolloverStrategy
#appender.rolling.strategy.max = 5

appender.console.type = Console
appender.console.name = plain_console
appender.console.layout.type = PatternLayout
appender.console.layout.pattern = [%d{ISO8601}][%-5p][%-25c] %m%n

appender.json_console.type = Console
appender.json_console.name = json_console
appender.json_console.layout.type = JSONLayout
appender.json_console.layout.compact = true
appender.json_console.layout.eventEol = true

rootLogger.level = ${sys:ls.log.level}
rootLogger.appenderRef.rolling.ref = RollingFile
rootLogger.appenderRef.console.ref = ${sys:ls.log.format}_console

因为不同版本有不同的配置所以最好还是先不挂载进行运行。然后将里面的配置文件考出来之后修改，然后删除容器后重新挂载修改

3.运行容器

elasticsearch、kibana、logstash版本必须一致。如果使用springboot集成需要注意和spring版本统一。

1. docker compose一键搭建

在elk目录创建：

vim docker-compose.yml

内容如下：

services:
  elasticsearch:
    image: elasticsearch:6.5.4
    container_name: elasticsearch
    ports:
      - "9200:9200"
      - "9300:9300"
    environment:
      - cluster.name=elasticsearch
      - discovery.type=single-node
      - "ES_JAVA_OPTS=-Xms512m -Xmx512m"
    volumes:
      - /usr/docker/elk/elasticsearch/plugins:/usr/share/elasticsearch/plugins
      - /usr/docker/elk/elasticsearch/data:/usr/share/elasticsearch/data
      - /usr/docker/elk/elasticsearch/logs:/usr/share/elasticsearch/logs

  kibana:
    image: kibana:6.5.4
    container_name: kibana
    ports:
      - "5601:5601"
    depends_on:
      - elasticsearch
    environment:
      I18N_LOCALE: zh-CN
    volumes:
      - /usr/docker/elk/kibana/config/kibana.yml:/usr/share/kibana/config/kibana.yml

  logstash:
    image: logstash:6.5.4
    container_name: logstash
    ports:
      - "5044:5044"
    volumes:
      - /usr/docker/elk/logstash/config:/usr/share/logstash/config
    depends_on:
      - elasticsearch

使用docker compose 命令运行

一定要在docker-compose.yml所在目录执行命令！！

docker compose up -d

2.单独运行

运行elasticsearch

docker run --name elasticsearch -p 9200:9200 -p 9300:9300 -e "discovery.type=single-node" -e ES_JAVA_OPTS="-Xms64m -Xmx512m" -v /usr/docker/elk/elasticsearch/config/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml -v /usr/docker/elk/elasticsearch/data:/usr/share/elasticsearch/data -v  /usr/docker/elk/elasticsearch/plugins:/usr/share/elasticsearch/plugins -d elasticsearch:6.5.4

运行Kibana

docker run --name kibana -v /usr/docker/elk/kibana/config/kibana.yml:/usr/share/kibana/config/kibana.yml -p 5601:5601 -d kibana:6.5.4

运行Logstash

docker run -d -p 5044:5044 -v /usr/docker/elk/logstash/config:/usr/share/logstash/config --name logstash logstash:6.5.4

三、项目集成

我这里使用的是spring-boot-starter-data-elasticsearch包集成。需要注意版本限制。

maven引入依赖

		<dependency>
			<groupId>org.springframework.boot</groupId>
			<artifactId>spring-boot-starter-data-elasticsearch</artifactId>
		</dependency>

修改yml文件
根据版本不同有的可能不一样。需要自己查看自己版本的

  data:
    elasticsearch:
      cluster-nodes: 192.168.1.37:9200
      cluster-name: elasticsearch

定义映射对象

import com.baomidou.mybatisplus.extension.activerecord.Model;
import lombok.Data;
import lombok.EqualsAndHashCode;
import org.springframework.data.annotation.Id;
import org.springframework.data.elasticsearch.annotations.Document;
import org.springframework.data.elasticsearch.annotations.Field;
import org.springframework.data.elasticsearch.annotations.FieldType;

import java.math.BigDecimal;
import java.time.LocalDateTime;

/**
 * 资源管理-es映射
 *
 * @date 2025年03月13日13:15:34
 */
@EqualsAndHashCode(callSuper = true)
@Data
@Document(indexName = "resource_manage", type = "doc", useServerConfiguration = true, createIndex = false)
public class EsResourceManage extends Model<EsResourceManage> {

    private static final long serialVersionUID = 1L;

    /**
     * id
     */
    @Id
    private String resources_id;
    /**
     * 资源名称
     */
    @Field(type = FieldType.Text)
    private String resources_name;

    /**
     * 资源类型(1:文件夹,2:视频,3:文档,4:图片,5:音频,6:模型)
     */
    private String resources_type;
    /**
     * 资源大小
     */
    private BigDecimal resources_size;
    /**
     * 资源后缀(doc,txt,jpg,mp4等)
     */
    private String resource_suffix;
    /**
     * 外部存储路径
     */
    private String out_path;
   
}

方式一：继承 ElasticsearchRepository

ElasticsearchRepository 提供了一个高级的抽象，使得你可以在不编写任何实现代码的情况下，直接使用预定义的CRUD方法和查询方法。

/**
 * es映射-Repository类
 * @author ：lzy
 * @date ：2025/3/13 13:16
 */
@Repository
public interface EsResourceManageRepository extends ElasticsearchRepository<EsResourceManage, String> {

}

然后就可以直接使用了,属性jpa的同学可以直接上手
在这里插入图片描述

方式二：使用ElasticsearchRestTemplate

与 ElasticsearchRepository 相比，ElasticsearchRestTemplate 更适合用于复杂查询。
比如多个条件组合、范围查询、模糊查询、聚合查询等复杂场景
还支持分页、排序、过滤等高级功能

@RestController
@RequestMapping("/employeeInfo")
public class EmployeeElasticController {

    @Autowired
    private ElasticsearchRestTemplate elasticsearchRestTemplate;
    
    @RequestMapping("/template/save")
    public String  templateSave() throws Exception  {
        SimpleDateFormat simpleDateFormat = new SimpleDateFormat("yyyy-MM-dd");
        EmployeeInfo employeeInfo = new EmployeeInfo(8888L, "2001", "张八", "zhangsan", "Java", 1, 19, new BigDecimal("12500.01"), simpleDateFormat.parse("2019-09-10"), "备注");
        elasticsearchRestTemplate.save(employeeInfo);
        return "success";
    }