当前位置: 首页 > article >正文

日志收集Day005

1.filebeat的input类型之filestream实战案例:

在7.16版本中已经弃用log类型,之后需要使用filebeat,与log不同,filebeat的message无需设置就是顶级字段

1.1简单使用:

filebeat.inputs:
- type: filestream
  enabled: true
  paths:
    - /tmp/myfilestream01.log
output.console:
  pretty: true

1.2解析json格式数据

filebeat.inputs:
  # 指定类型为filestream,在7.16版本中已经弃用log类型
- type: filestream
  enabled: true
  paths:
    - /tmp/myfilestream02.log
  parsers:
    # 配置json格式解析
    - ndjson:
       # 将错误消息记录到error字段中
       add_error_key: true
       # 如果解析的json格式字段和filebeat内置的顶级字段冲突,则覆盖,默认是不覆盖的。
       overwrite_keys: true
       # 将message解析的字段放入一个自定义的字段下。若不指定该字段,则默认解析的键值对会在顶级字段.
       target: readjson

output.console:
  pretty: true

1.3多行合并案例

filebeat.inputs:
  # 指定类型为filestream,在7.16版本中已经弃用log类型
- type: filestream
  enabled: true
  paths:
    - /tmp/myfilestream02.log
  parsers:
    - multiline:
        type: count
        count_lines: 4
    - ndjson:
       add_error_key: true
       overwrite_keys: true
       target: readjson

output.console:
  pretty: true

2.写入数据到es集群

filebeat.inputs:
- type: filestream
  enabled: true
  paths:
    - /tmp/shopping.json
  parsers:
    - multiline:
        type: count
        count_lines: 7
    - ndjson:
       add_error_key: true
       overwrite_keys: true

# 将日志输出到ES集群
output.elasticsearch:
  # 指定ES集群地址
  hosts: ["http://10.0.0.101:9200","http://10.0.0.102:9200","http://10.0.0.103:9200"]
  # 指定索引
  index: "shopping-%{+yyyy.MM.dd}-output"

# 禁用索引声明管理周期,若不禁用则自动忽略自定义索引名称
setup.ilm.enabled: false
# 设置索引模板的名称
setup.template.name: "lxc-shopping"
# 指定索引模板的匹配模式
setup.template.pattern: "lxc-shopping-*"
# 是否覆盖原有的索引模板
setup.template.overwrite: true
# 设置索引模板
setup.template.settings:
  # 指定分片数量为8
  index.number_of_shards: 8
  # 指定副本数量为0
  index.number_of_replicas: 0

3.多数据源写入es集群不同索引

filebeat.inputs:

- type: filestream
  enabled: true
  tags: "json"
  paths:
    - /tmp/ceshi.json
  parsers:
    - ndjson:
       add_error_key: true
       #overwrite_keys: true


- type: filestream
  enabled: true
  tags: "log"
  paths:
    - /tmp/ceshi.log
  parsers:
    - multiline:
        type: count
        count_lines: 3


- type: filestream
  enabled: true
  tags: "shopping"
  paths:
    - /tmp/shopping.json
  parsers:
    - multiline:
        type: count
        count_lines: 7
    - ndjson:
       add_error_key: true
       overwrite_keys: true
       target: shopping


output.elasticsearch:
  hosts: 
  - "http://10.0.0.101:9200"
  - "http://10.0.0.102:9200"
  - "http://10.0.0.103:9200"
  indices:
     - index: "filebeate-14-json-docker-%{+yyyy.MM.dd}"
       when.contains:
         tags: "json"
     - index: "filebeate-14-log-%{+yyyy.MM.dd}"
       when.contains:
         tags: "log"
     - index: "filebeate-14-shopping-%{+yyyy.MM.dd}"
       when.contains:
         tags: "shopping"

setup.ilm.enabled: false
setup.template.name: "filebeate-14"
setup.template.pattern: "filebeate-14-*"
setup.template.overwrite: true
setup.template.settings:
  index.number_of_shards: 4
  index.number_of_replicas: 1

解析:这个配置是针对有多个数据源采集到es集群的一个例子。三个type分别代表三个数据源,output.elasticsearch.hosts设置了es集群的ip,includes下三个index分别包含上面的三个type,注意这里的index名称需要和下面设置的setup.template.pattern匹配,否则索引模板不生效。可以通过curl 10.0.0.101:9200/filebeate-14-shopping-2025.01.23/_search,检验数据是否成功写入,详见之前文档,这里不多赘述。另外,值得注意的是,副本分片数量应该小于节点数量(可写入节点)。

4.logstash的安装

二进制安装:

1.解压安装包:tar xf logstash-7.17.5-linux-x86_64.tar.gz -C /app/softwares/

2.创建软链接:ln -svf /app/softwares/logstash-7.17.5/bin/logstash /usr/local/sbin/

3.验证logstash版本:logstash -V

4.基于命令行启动logstash实例:logstash -e "input { stdin { type => stdin } } output { stdout {} }"

5.编写第一个logstash

[root@elk101.lxcedu.com ~]# vim config/01-stdin-to-stdout.conf

input {
  stdin { type => stdin }
}

output {
  stdout {}
}

6.logstash搭配filebeat实战案例
1.编写logstash配置文件并启动(输入为filebeat的输入,输出到es集群)

vim 02-beats-to-stdout.conf

input {
  # 指定输入的类型是一个beats
  beats {
    # 指定监听的端口号
    port => 8888
  }
}

output {
  # 将数据写入ES集群
  elasticsearch {
    # 指定ES主机地址
    hosts => ["http://localhost:9200"]
    # 指定索引名称
    index => "my-logstash01"
  }
}

logstash -rf 02-beats-to-stdout.conf 

2.启动filebeat实例并写入数据

[root@elk101.lxcedu.com /app/softwares/filebeat-7.17.5-linux-x86_64/config]# vim 18-nginx-to-logstash.yaml

filebeat -e -c 18-nginx-to-logstash.yaml

filebeat.inputs:
- type: log
  paths:
    - /var/log/nginx/access.log*

# 将数据输出到logstash中
output.logstash:
  # 指定logstash的主机和端口
     hosts: ["10.0.0.101:8888"]

7.logstash的过滤插件之geoip实战案例:
1.logstash配置文件
vim config03-beats-geoip-es.conf

input { 
  # 指定输入的类型是一个beats
  beats {
    # 指定监听的端口号
    port => 8888
  }
} 


filter {
  # 根据IP地址分析客户端的经纬度,国家,城市信息等。
  geoip {
     source => "clientip"
     remove_field => [ "agent","log","input","host","ecs","tags" ]
  }

}

output { 
  
  # 将数据写入ES集群
  elasticsearch {
    # 指定ES主机地址
    hosts => ["http://localhost:9200"]
    # 指定索引名称
    index => "geoip-logstash"
  }
}

logstash -rf config/03-beats-geoip-es.conf

(2)filebeat采集数据到logstash

filebeat.inputs:
- type: log
  paths:
    - /var/log/nginx/access.log*
  json.keys_under_root: true
  json.add_error_key: true

# 将数据输出到logstash中
output.logstash:
  # 指定logstash的主机和端口
     hosts: ["10.0.0.101:8888"]

此时在kibana创建索引模式,

之后便可在Discover筛选出需要的值,进行查看

8.logstash解析nginx原生日志,并分析IP地址实战和修改日期字段数据类型

最好先创建索引模板,规划好分片和副本数量
1.logstash配置文件
vim config/04-beats-grok_geoip-es.conf

input { 
  beats {
    port => 8888
  }
} 


filter {
   #使用%%{HTTPD_COMBINEDLOG}解析日志
   grok {
      match => { "message" => "%{HTTPD_COMBINEDLOG}" }
      remove_field => [ "agent","log","input","host","ecs","tags" ]
   }

  geoip {
     source => "clientip"
  }
  
  date {
      # 匹配时间字符串字段并格式化
      # "22/Nov/2015:11:57:34 +0800",默认timestamp是keyword类型,不格式化无法在kbina分析
      match => [ "timestamp", "dd/MMM/yyyy:HH:mm:ss Z" ]
      # 匹配时区,可省略
      timezone => "Asia/Shanghai"
      # 将转后的日期替换为指定字段,若不指定,则默认值为"@timestamp"
      target => "time"
  }


}

output { 
   #stdout {} 
  
   elasticsearch {
    hosts => ["http://localhost:9200"]
    index => "nginx-logstash"
  }
}

启动:logstash -rf config/04-beats-grok_geoip-es.conf

2.filebeat采集数据到logstash

filebeat.inputs:
- type: log
  paths:
    - /tmp/access.log


# 将数据输出到logstash中
output.logstash:
   # 指定logstash的主机和端口
  hosts: ["10.0.0.101:8888"]

启动:filebeat -e -c 19-nginx-to-logstash.yaml

如下图kibana采集到的数据,可以看出上述对时间字段的修改生效

以上参考官方文档:

Logstash Introduction | Logstash Reference [7.17] | Elastic

grok正则匹配参考:

Grok filter plugin | Logstash Reference [7.17] | Elastic


http://www.kler.cn/a/517143.html

相关文章:

  • sqlzoo答案4:SELECT within SELECT Tutorial
  • 问题修复记录:Linux docker 部署 dify,无法调用宿主机本地服务
  • 服务器安装ESXI7.0系统及通过离线包方式升级到ESXI8.0
  • 计算机网络之网络层
  • Flutter 改完安卓 applicationId 后App 闪退问题。
  • RabbitMQ 高级特性
  • 数据结构(一)顺序表和链表
  • 【前端】如何依靠纯前端实现拍照获取/选择文件等文字识别OCR技术
  • 【HarmonyOS NAPI 深度探索10】HarmonyOS Next 中的 NAPI 的架构与原理
  • U3D的.Net学习
  • 阿里云服务器在Ubuntu上安装redis并使用
  • Java 生成 PDF 文档 如此简单
  • OpenAI秘密重塑机器人军团: 实体AGI的崛起!
  • ngrok同时配置多个内网穿透方法
  • 航空航天混合动力(7)航空航天分布式电推进系统
  • ChopChopGo:一款针对Linux的取证数据快速收集工具
  • 【Unity】ScrollViewContent适配问题(Contentsizefilter不刷新、ContentSizeFilter失效问题)
  • 提升效率与体验,让笔记更智能
  • Java导出通过Word模板导出docx文件并通过QQ邮箱发送
  • 深入探索imi框架:PHP Swoole的高性能协程应用实践
  • 深入解析:Docker 容器如何实现文件系统与资源的多维隔离?
  • Go 不可重复协程安全队列
  • 全同态加密理论、生态现状与未来展望(下)
  • 华为OD机试E卷 --快递投放问题 --24年OD统一考试(Java JS Python C C++)
  • Redis Java 集成到 Spring Boot
  • 修改docker共享内存shm-size