第13章 Zabbix分布式监控企业实战
企业服务器对用户提供服务,作为运维工程师最重要的事情就是保证该网站正常稳定的运行,需要实时监控网站、服务器的运行状态,并且有故障及时去处理。
监控网站无需人工时刻去访问WEB网站或者登陆服务器去检查,可以借助开源监控软件例如Zabbix、Cacti、Nagios、Ganglia等来实现对网站的7x24小时的监控,并且做到有故障及时报警通知SA解决。
本章向读者介绍企业级分布式监控Zabbix入门、Zabbix监控原理、最新版本Zabbix安装实战、Zabbix批量监控客户端、监控MYSQL、WEB关键词及微信报警等。
13.1 Zabbix监控系统入门简介
Zabbix是一个基于WEB界面的提供分布式系统监控的企业级的开源解决方案,Zabbix能监视各种网络参数,保证服务器系统的安全稳定的运行,并提供灵活的通知机制以让SA快速定位并解决存在的各种问题。Zabbix分布式监控系统的优点如下:
支持自动发现服务器和网络设备;
支持底层自动发现;
分布式的监控体系和集中式的WEB管理;
支持主动监控和被动监控模式;
服务器端支持多种操作系统:Linux, Solaris, HP-UX, AIX, FreeBSD, OpenBSD, MAC等;
Agent客户端支持多种操作系统:Linux, Solaris, HP-UX, AIX, FreeBSD,Windows等;
基于SNMP、IPMI接口方式、Agent方式;
安全的用户认证及权限配置;
基于WEB的管理方法,支持自由的自定义事件和邮件、短信发送;
高水平的业务视图监控资源,支持日志审计,资产管理等功能;
支持高水平API二次开发、脚本监控、自Key定义、自动化运维整合调用。
13.2 Zabbix监控组件及流程
Zabbix监控组件如图13-1所示,主要由三大组件,分别是Zabbix server端、Zabbix Proxy、Agent客户端,其中Zabbix Server端包括:WEB GUI、Database、Zabbix_Server。
图13-1 Zabbix监控组件
Zabbix监控系统具体监控系统流程如图13-2所示:
图13-2 Zabbix监控流程图
Zabbix监控完整流程包括:Agentd安装在被监控的主机上,Agent负责定期收集客户端本地各项数据,并发送到Zabbix Server端,Zabbix Server收到数据,将数据存储到数据库中,用户基于Zabbix WEB可以看到数据在前端展现图像。
当Zabbix监控某个具体的项目,该项目会设置一个触发器阀值,当被监控的指标超过该触发器设定的阀值,会进行一些必要的动作,动作包括:邮件、微信报警或者执行命令等操作。如下为Zabbix完整监控系统,各个部分负责的工作:
Zabbix Server:负责接收agent发送的报告信息的核心组件,所有配置,统计数据及操作数据均由其组织进行;
Database Storage:专用于存储所有配置信息,以及存储由Zabbix收集到的数据;
Web interface:Zabbix的GUI接口,通常与Server运行在同一台主机上;
Proxy:常用于分布监控环境中,代理Server收集部分被监控端的监控数据并统一发往Server端;
Zabbix Agent:部署在被监控主机上,负责收集本地数据并发往Server端或Proxy端;
Zabbix监控部署在系统中,会包含常见的四个程序:zabbix_server 、zabbix_get、zabbix_agentd 、zabbix_proxy、zabbix_sender等。四个程序启动后分别对应四个进程,如下为每个进程的功能:
Zabbix_server:Zabbix服务端守护进程,其中zabbix_agentd、zabbix_get、zabbix_sender、zabbix_proxy的数据最终均是提交给Zabbix_Server;
Zabbix_Agentd:客户端守护进程,负责收集客户端数据,例如收集cpu负载、内存、硬盘使用情况等;
Zabbix_get:Zabbix数据获取工具,单独使用的命令,通常在server或者proxy端执行获取远程客户端信息的命令;
Zabbix_sender:zabbix数据发送工具,用于发送数据给server或者proxy,通常用于耗时比较长的检查。很多检查非常耗时间,导致zabbix超时。于是我们在脚本执行完毕之后,使用sender主动提交数据;
Zabbix_proxy:zabbix分布式代理守护进程,分布式监控架构需要部署Zabbix_Proxy。
13.3 Zabbix监控平台概念
Zabbix监控系统包括很多监控概念,掌握Zabbix监控概念能对Zabbix监控快速的理解,如下为Zabbix常用术语及解释。
主机(host): 被监控的网络设备,可以写IP或者DNS;
主机组(host group): 主机组用于管理主机,可以批量设置权限;
监控项(item): 具体监控项,items值由独立的keys进行识别;
触发器(trigger):为某个items设置触发器,达到触发器会执行action动作;
事件(event): 例如达到某个触发器,称之为一个事件;
动作(action): 对于特定事件事先定义的处理方法,默认可以发送信息及发送命令;
报警升级(escalation):发送警报或执行远程命令的自定义方案,如隔5分钟发送一次警报,共发送5次等;
媒介(media):发送通知的方式,可以支持Mail、SMS、Scripts等;
通知(notification):通过设置的媒介向用户发送的有关某事件的信息;
远程命令 : 达到触发器,可以在被监控端执行命令;
模板(template): 可以快速监控被监控端,模块包含:item、trigger、graph、screen、application;
web场景(web scennario):用于检测web站点可用性,监控HTTP关键词;
web前端(frontend):Zabbix的web接口;
图形(graph) : 监控图像;
屏幕(screens): 屏幕显示;
幻灯(slide show): 幻灯显示。
13.4 Zabbix监控平台部署
(1) Zabbix Server端和Zabbix Agent执行如下代码:
Zabbix监控平台部署,至少需要安装四个组件,分别是Zabbix_Server、Zabbix_Web、Databases、Zabbix_Agent,如下为Zabbix监控平台安装配置详细步骤:
(2) 系统环境
Server端:192.168.149.128
Agent端:192.168.149.129
(3) 下载zabbix版本,各个版本之间安装方法相差不大,可以根据实际情况选择安装版本,本文版本为Zabbix-3.2.6.tar.gz。
wget https://jaist.dl.sourceforge.net/project/zabbix/ZABBIX%20Latest%20Stable/3.2.6/zabbix-3.2.6.tar.gz
yum -y install curl curl-devel net-snmp net-snmp-devel perl-DBI
groupadd zabbix
useradd -g zabbix zabbix
usermod -s /sbin/nologin zabbix
(4) Zabbix Server端配置
创建zabbix数据库,执行授权命令:
create database zabbix charset=utf8;
grant all on zabbix.* to zabbix@localhost identified by '123456';
flush privileges;
解压zabbix软件包并将Zabbix基础SQL文件导入数据至Zabbix数据库:
tar zxvf zabbix-3.2.6.tar.gz
cd zabbix-3.2.6
mysql -uzabbix -p123456 zabbix <database/mysql/schema.sql
mysql -uzabbix -p123456 zabbix <database/mysql/images.sql
mysql -uzabbix -p123456 zabbix < database/mysql/data.sql
切换至Zabbix解压目录,执行如下代码,安装Zabbix_server:
./configure --prefix=/usr/local/zabbix/ --enable-server --with-mysql --enable-ipv6 --with-net-snmp --with-libcurl
make
make install
ln -s /usr/local/zabbix/sbin/zabbix_* /usr/local/sbin/
Zabbix server安装完毕,cd /usr/local/zabbix/etc/目录,如图13-3所示:
图13-3 Zabbix监控流程图
备份Zabbix server配置文件,代码如下:
cp zabbix_server.conf zabbix_server.conf.bak
将zabbix_server.conf配置文件中代码设置为如下:
LogFile=/tmp/zabbix_server.log
DBHost=localhost
DBName=zabbix
DBUser=zabbix
DBPassword=123456
同时cp zabbix_server启动脚本至/etc/init.d/目录,启动zabbix_server, Zabbix_server默认监听端口为10051。
cd zabbix-3.2.6
cp misc/init.d/tru64/zabbix_server /etc/init.d/zabbix_server
chmod o+x /etc/init.d/zabbix_server
配置Zabbix interface Web页面,安装HTTP WEB服务器,将Zabbix WEB代码发布至Apache默认发布目录,由于Zabbix3.2+ PHP版本需要使用PHP5.4.0版本,请将本机PHP版本升级至5.4.0+,PHP5.3升级至PHP5.6,代码如下:
rpm -Uvh http://repo.webtatic.com/yum/el6/latest.rpm
yum remove php*
yum install php56w.x86_64 php56w-cli.x86_64 php56w-common.x86_64 php56w-gd.x86_64 php56w-ldap.x86_64 php56w-mbstring.x86_64 php56w-mcrypt.x86_64 php56w-mysql.x86_64 php56w-pdo.x86_64 -y
yum install httpd httpd-devel httpd-tools -y
cp -a /root/zabbix-3.2.6/frontends/php/* /var/www/html/
sed -i '/date.timezone/i date.timezone = PRC' /etc/php.ini
重新启动Zabbix Server、HTTP、MYSQL服务,代码如下:
/etc/init.d/zabbix_server restart
/etc/init.d/httpd restart
/etc/init.d/mysqld restart
(5) Zabbix WEB GUI安装配置
通过浏览器Zabbix_WEB验证,通过浏览器访问http://192.168.149.128/,如图13-4所示:
图13-4 Zabbix WEB安装界面
单击下一步,出现如图13-5所示,如果有错误提示,需要把错误依赖解决完,方可进行下一步操作。
图13-5 Zabbix WEB安装错误提示
如上异常错误解决方法代码如下,安装缺失的软包,并修改php.ini对应参数的值即可,如图13-6所示:
yum install php-mbstring php-bcmath php-gd php-xml -y
yum install gd gd-devel -y
sed -i '/post_max_size/s/8/16/g;/max_execution_time/s/30/300/g;/max_input_time/s/60/300/g;s/\;date.timezone.*/date.timezone \= PRC/g;s/\;always_populate_raw_post_data/always_populate_raw_post_data/g' /etc/php.ini
service httpd restart
图13-6 Zabbix WEB测试安装环境
单击下一步,如图13-7所示,配置数据库连接,输入数据库名、用户、密码,单击Test connection,显示OK,单击下一步即可。
图13-7 Zabbix WEB数据库配置
继续单击下一步出现如图13-8所示,填写Zabbix Title显示,可以为空,可以输入自定义的名称。
图13-8 Zabbix WEB详细信息
单击下一步,如图13-9所示,需修创建zabbix.conf.php文件,执行如下命令,或者单击“Download the configuration file”下载zabbix.conf.php文件,并将该文件上传至/var/www/html/conf/,并设置可写权限,刷新WEB页面,zabbix.conf.php内容代码如下,最后单击Finish即可: