当前位置: 首页 > article >正文

第13章 Zabbix分布式监控企业实战

企业服务器对用户提供服务,作为运维工程师最重要的事情就是保证该网站正常稳定的运行,需要实时监控网站、服务器的运行状态,并且有故障及时去处理。

监控网站无需人工时刻去访问WEB网站或者登陆服务器去检查,可以借助开源监控软件例如Zabbix、Cacti、Nagios、Ganglia等来实现对网站的7x24小时的监控,并且做到有故障及时报警通知SA解决。
本章向读者介绍企业级分布式监控Zabbix入门、Zabbix监控原理、最新版本Zabbix安装实战、Zabbix批量监控客户端、监控MYSQL、WEB关键词及微信报警等。

13.1 Zabbix监控系统入门简介

Zabbix是一个基于WEB界面的提供分布式系统监控的企业级的开源解决方案,Zabbix能监视各种网络参数,保证服务器系统的安全稳定的运行,并提供灵活的通知机制以让SA快速定位并解决存在的各种问题。Zabbix分布式监控系统的优点如下:

 支持自动发现服务器和网络设备;
 支持底层自动发现;
 分布式的监控体系和集中式的WEB管理;
 支持主动监控和被动监控模式;
 服务器端支持多种操作系统:Linux, Solaris, HP-UX, AIX, FreeBSD, OpenBSD, MAC等;
 Agent客户端支持多种操作系统:Linux, Solaris, HP-UX, AIX, FreeBSD,Windows等;
 基于SNMP、IPMI接口方式、Agent方式;
 安全的用户认证及权限配置;
 基于WEB的管理方法,支持自由的自定义事件和邮件、短信发送;
 高水平的业务视图监控资源,支持日志审计,资产管理等功能;
 支持高水平API二次开发、脚本监控、自Key定义、自动化运维整合调用。

13.2 Zabbix监控组件及流程

Zabbix监控组件如图13-1所示,主要由三大组件,分别是Zabbix server端、Zabbix Proxy、Agent客户端,其中Zabbix Server端包括:WEB GUI、Database、Zabbix_Server。

在这里插入图片描述

图13-1 Zabbix监控组件

Zabbix监控系统具体监控系统流程如图13-2所示:
在这里插入图片描述

图13-2 Zabbix监控流程图

Zabbix监控完整流程包括:Agentd安装在被监控的主机上,Agent负责定期收集客户端本地各项数据,并发送到Zabbix Server端,Zabbix Server收到数据,将数据存储到数据库中,用户基于Zabbix WEB可以看到数据在前端展现图像。

当Zabbix监控某个具体的项目,该项目会设置一个触发器阀值,当被监控的指标超过该触发器设定的阀值,会进行一些必要的动作,动作包括:邮件、微信报警或者执行命令等操作。如下为Zabbix完整监控系统,各个部分负责的工作:

 Zabbix Server:负责接收agent发送的报告信息的核心组件,所有配置,统计数据及操作数据均由其组织进行;
 Database Storage:专用于存储所有配置信息,以及存储由Zabbix收集到的数据;
 Web interface:Zabbix的GUI接口,通常与Server运行在同一台主机上;
 Proxy:常用于分布监控环境中,代理Server收集部分被监控端的监控数据并统一发往Server端;
 Zabbix Agent:部署在被监控主机上,负责收集本地数据并发往Server端或Proxy端;
Zabbix监控部署在系统中,会包含常见的四个程序:zabbix_server 、zabbix_get、zabbix_agentd 、zabbix_proxy、zabbix_sender等。四个程序启动后分别对应四个进程,如下为每个进程的功能:
 Zabbix_server:Zabbix服务端守护进程,其中zabbix_agentd、zabbix_get、zabbix_sender、zabbix_proxy的数据最终均是提交给Zabbix_Server;
 Zabbix_Agentd:客户端守护进程,负责收集客户端数据,例如收集cpu负载、内存、硬盘使用情况等;
 Zabbix_get:Zabbix数据获取工具,单独使用的命令,通常在server或者proxy端执行获取远程客户端信息的命令;
 Zabbix_sender:zabbix数据发送工具,用于发送数据给server或者proxy,通常用于耗时比较长的检查。很多检查非常耗时间,导致zabbix超时。于是我们在脚本执行完毕之后,使用sender主动提交数据;
 Zabbix_proxy:zabbix分布式代理守护进程,分布式监控架构需要部署Zabbix_Proxy。

13.3 Zabbix监控平台概念

Zabbix监控系统包括很多监控概念,掌握Zabbix监控概念能对Zabbix监控快速的理解,如下为Zabbix常用术语及解释。

主机(host): 被监控的网络设备,可以写IP或者DNS;
主机组(host group): 主机组用于管理主机,可以批量设置权限;
监控项(item): 具体监控项,items值由独立的keys进行识别;
触发器(trigger):为某个items设置触发器,达到触发器会执行action动作;
事件(event): 例如达到某个触发器,称之为一个事件;
动作(action): 对于特定事件事先定义的处理方法,默认可以发送信息及发送命令;
报警升级(escalation):发送警报或执行远程命令的自定义方案,如隔5分钟发送一次警报,共发送5次等;
媒介(media):发送通知的方式,可以支持Mail、SMS、Scripts等;
通知(notification):通过设置的媒介向用户发送的有关某事件的信息;
远程命令 : 达到触发器,可以在被监控端执行命令;
模板(template): 可以快速监控被监控端,模块包含:item、trigger、graph、screen、application;
web场景(web scennario):用于检测web站点可用性,监控HTTP关键词;
web前端(frontend):Zabbix的web接口;
图形(graph) : 监控图像;
屏幕(screens): 屏幕显示;
幻灯(slide show): 幻灯显示。

13.4 Zabbix监控平台部署

(1) Zabbix Server端和Zabbix Agent执行如下代码:
Zabbix监控平台部署,至少需要安装四个组件,分别是Zabbix_Server、Zabbix_Web、Databases、Zabbix_Agent,如下为Zabbix监控平台安装配置详细步骤:

(2) 系统环境
Server端:192.168.149.128
Agent端:192.168.149.129

(3) 下载zabbix版本,各个版本之间安装方法相差不大,可以根据实际情况选择安装版本,本文版本为Zabbix-3.2.6.tar.gz。

wget https://jaist.dl.sourceforge.net/project/zabbix/ZABBIX%20Latest%20Stable/3.2.6/zabbix-3.2.6.tar.gz 
yum -y  install  curl  curl-devel net-snmp net-snmp-devel perl-DBI
groupadd  zabbix
useradd  -g  zabbix zabbix
usermod  -s  /sbin/nologin  zabbix

(4) Zabbix Server端配置
创建zabbix数据库,执行授权命令:

create  database  zabbix  charset=utf8;
grant all on zabbix.* to zabbix@localhost identified by '123456';
flush privileges;

解压zabbix软件包并将Zabbix基础SQL文件导入数据至Zabbix数据库:

tar   zxvf  zabbix-3.2.6.tar.gz
cd   zabbix-3.2.6
mysql -uzabbix -p123456 zabbix <database/mysql/schema.sql
mysql -uzabbix -p123456 zabbix <database/mysql/images.sql
mysql -uzabbix -p123456 zabbix < database/mysql/data.sql

切换至Zabbix解压目录,执行如下代码,安装Zabbix_server:

./configure --prefix=/usr/local/zabbix/ --enable-server --with-mysql --enable-ipv6 --with-net-snmp  --with-libcurl
make
make install
ln -s /usr/local/zabbix/sbin/zabbix_*  /usr/local/sbin/

Zabbix server安装完毕,cd /usr/local/zabbix/etc/目录,如图13-3所示:

在这里插入图片描述

图13-3 Zabbix监控流程图

备份Zabbix server配置文件,代码如下:

cp  zabbix_server.conf  zabbix_server.conf.bak

将zabbix_server.conf配置文件中代码设置为如下:

LogFile=/tmp/zabbix_server.log
DBHost=localhost
DBName=zabbix
DBUser=zabbix
DBPassword=123456

同时cp zabbix_server启动脚本至/etc/init.d/目录,启动zabbix_server, Zabbix_server默认监听端口为10051。

cd  zabbix-3.2.6
cp  misc/init.d/tru64/zabbix_server  /etc/init.d/zabbix_server
chmod  o+x  /etc/init.d/zabbix_server

配置Zabbix interface Web页面,安装HTTP WEB服务器,将Zabbix WEB代码发布至Apache默认发布目录,由于Zabbix3.2+ PHP版本需要使用PHP5.4.0版本,请将本机PHP版本升级至5.4.0+,PHP5.3升级至PHP5.6,代码如下:

rpm -Uvh http://repo.webtatic.com/yum/el6/latest.rpm
yum remove php*
yum install php56w.x86_64 php56w-cli.x86_64 php56w-common.x86_64 php56w-gd.x86_64 php56w-ldap.x86_64 php56w-mbstring.x86_64 php56w-mcrypt.x86_64 php56w-mysql.x86_64 php56w-pdo.x86_64  -y
yum   install  httpd  httpd-devel  httpd-tools  -y
cp -a   /root/zabbix-3.2.6/frontends/php/*    /var/www/html/
sed    -i   '/date.timezone/i date.timezone = PRC'   /etc/php.ini

重新启动Zabbix Server、HTTP、MYSQL服务,代码如下:

/etc/init.d/zabbix_server  restart
/etc/init.d/httpd     restart 
/etc/init.d/mysqld   restart

(5) Zabbix WEB GUI安装配置
通过浏览器Zabbix_WEB验证,通过浏览器访问http://192.168.149.128/,如图13-4所示:

在这里插入图片描述

图13-4 Zabbix WEB安装界面

单击下一步,出现如图13-5所示,如果有错误提示,需要把错误依赖解决完,方可进行下一步操作。

在这里插入图片描述

图13-5 Zabbix WEB安装错误提示

如上异常错误解决方法代码如下,安装缺失的软包,并修改php.ini对应参数的值即可,如图13-6所示:

yum  install  php-mbstring  php-bcmath  php-gd  php-xml  -y
yum  install  gd  gd-devel  -y
sed   -i '/post_max_size/s/8/16/g;/max_execution_time/s/30/300/g;/max_input_time/s/60/300/g;s/\;date.timezone.*/date.timezone \= PRC/g;s/\;always_populate_raw_post_data/always_populate_raw_post_data/g'  /etc/php.ini
service  httpd  restart

在这里插入图片描述

图13-6 Zabbix WEB测试安装环境

单击下一步,如图13-7所示,配置数据库连接,输入数据库名、用户、密码,单击Test connection,显示OK,单击下一步即可。

在这里插入图片描述

图13-7 Zabbix WEB数据库配置

继续单击下一步出现如图13-8所示,填写Zabbix Title显示,可以为空,可以输入自定义的名称。

在这里插入图片描述

图13-8 Zabbix WEB详细信息

单击下一步,如图13-9所示,需修创建zabbix.conf.php文件,执行如下命令,或者单击“Download the configuration file”下载zabbix.conf.php文件,并将该文件上传至/var/www/html/conf/,并设置可写权限,刷新WEB页面,zabbix.conf.php内容代码如下,最后单击Finish即可:


http://www.kler.cn/a/393683.html

相关文章:

  • acwing算法基础02一高精度,前缀和,差分
  • Vector Optimization – Stride
  • 【面试题】发起一次网络请求,当请求>=1s,立马中断
  • 应用于新能源汽车NCV4275CDT50RKG车规级LDO线性电压调节器芯片
  • css:盒子模型
  • 微服务day07
  • 【JavaWeb】JSON介绍及入门案例
  • (动画版)排序算法 -选择排序
  • 单片机中的BootLoader(重要的概念讲解)
  • C语言中,让人又爱又恨的字符串编码
  • Python学习从0到1 day26 第三阶段 Spark ③ 数据计算 Ⅱ
  • java作业项目以及azkaban的操作
  • Java入门16——接口
  • exo - 使用日常设备运行AI集群
  • Linux 系统上部署 RabbitMQ
  • Python 正则表达式进阶用法:分组与引用详解
  • 数据挖掘在金融交易中的应用:民锋科技的智能化布局
  • Linux:进程概念
  • dto,vo这些有什么用
  • 万字长文解读深度学习——Transformer
  • SpringBoot(4)- data整合
  • 实习冲刺Day21
  • JSX 是react 专有的吗
  • Simulink中Matlab function使用全局变量
  • 我们来学mysql -- EXPLAIN之select_type(原理篇)
  • Rocky9/Ubuntu使用pip安装python的库mysqlclient失败解决方式