Linux中日志管理和常见故障
♥️作者:小刘在C站
♥️个人主页:小刘主页
♥️每天分享云计算网络运维课堂笔记,努力不一定有收获,但一定会有收获加油!一起努力,共赴美好人生!
♥️夕阳下,是最美的绽放,树高千尺,落叶归根人生不易,人间真情
目录
一、关于日志及管理
1.日志的功能
2.日志文件的分类
3.日志保存位置
4.主要日志文件介绍
5.日志配置文件
6.日志级别
7.日志一般格式
8.程序日志
9.分析工具
10.日志管理策略
二、常见故障.
1、MBR故障修复
2、GRUB 引导故障
3、修复文件系统
4、硬盘i节点耗尽
5、磁盘坏道
案例三、模拟文件系统超级块损坏并修复
案例四、案例四、磁盘i节点耗尽故障及解决
案例五、检查并修复磁盘坏道
一、关于日志及管理
1.日志的功能
用于记录系统、程序运行中发生的各种事件
通过阅读日志,有助于诊断和解决系统故障
2.日志文件的分类
内核及系统日志
由系统服务rsyslog统一进行管理,日志格式基本相似
用户日志
记录系统用户登录及退出系统的相关信息
程序日志
由各种应用程序独立管理的日志文件,记录格式不统一
3.日志保存位置
默认位于:/var/log 目录下
4.主要日志文件介绍
内核及系统日志
/var/log/messages
计划任务日志
/var/log/cron
系统引导日志
/var/log/dmesg
邮件系统日志
/var/log/maillog
用户登录日志
/var/log/lastlog:最近的用户登录事件
/var/log/wtmp:用户成功登录、注销及系统开、关机事件,对应命令 last
/var/log/btmp: 用户失败登录,错误验证尝试事件,对应命令 lastb
/var/run/utmp:当前登录的每个用户的详细信息,对应查看命令 users who w
/var/log/secure:与用户验证相关的安全性事件
5.日志配置文件
/etc/rsyslog.conf
*.info #任何服务info级别及以上日志
mail.none #例外,不记录
6.日志级别
0 EMERG(紧急/疼痛):会导致主机系统不可用的情况
1 ALERT(警告):必须马上采取措施解决的问题
2 CRIT(严重):比较严重的情况
3 ERR(错误):运行出现错误
4 WARNING(提醒):可能会影响系统功能的事件
5 NOTICE(注意):不会影响系统但值得注意
6 INFO(信息):一般信息
7 DEBUG(调试):程序或系统调试信息等
7.日志一般格式
Jun 3 13:26:35 localhost vmusr[2439]: [critical] [GLib-GObject]
时间标签 主机 子系统名 日志级别和信息
8.程序日志
由相应的应用程序独立进行管理
Web服务:/var/log/httpd/
access_log、error_log
代理服务:/var/log/squid/
access.log、cache.log、
9.分析工具
文本查看、grep过滤检索、Webmin管理套件中查看
awk、sed等文本过滤、格式化编辑工具
Webalizer、Awstats等专用日志分析工具
10.日志管理策略
及时作好备份和归档
延长日志保存期限
控制日志访问权限:日志中可能会包含各类敏感信息,如账户、口令等
集中管理日志:
将服务器的日志文件发到统一的日志文件服务器(ELK)
便于日志信息的统一收集、整理和分析
杜绝日志信息的意外丢失、恶意篡改或删除
二、常见故障.
1、MBR故障修复
Mbr扇区
引导程序GRUB 446
分区表 64
结束标志 2
故障原因:
病毒、木马等造成的破坏
不正确的分区操作、磁盘读写误操作
故障现象:
找不到引导程序,启动中断
无法加载操作系统,开机后黑屏
解决思路:
应提前作好备份文件
以 CentOS 7安装光盘引导进入急救模式
从备份文件中恢复
2、GRUB 引导故障
故障原因:
MBR 中的 GRUB 引导程序遭到破坏
grub.conf 文件丢失、引导配置有误
故障现象:
系统引导停滞,显示“grub>” 提示符
解决思路:
尝试手动输入引导命令
进入急救模式,重写或者从备份中恢复 grub.conf
向 MBR 扇区中重建 grub 程序
3、修复文件系统
故障原因
非正常关机、突然断电、设备读写失误等
文件系统的超级块(super-block)信息被破坏
故障现象
无法向分区中读取或写入数据
启动后提示“Give root password for maintenance”
解决思路
根据提示输入 root 口令,进入修复状态
使用xfs_repair命令进行修复
4、硬盘i节点耗尽
故障原因
磁盘空间已被大量的数据占满,空间耗尽
虽然还有可用空间,但文件数i节点耗尽
故障现象
无法写入新的文件,提示“… : 设备上没有空间”
部分程序无法运行,甚至系统无法启动
解决思路
清理磁盘空间,删除无用、冗余的文件
转移或删除占用大量 i 节点的琐碎文件
进入急救模式进行修复
为用户设置磁盘配额
5、磁盘坏道
故障原因
磁盘设备中存在坏道(逻辑的或物理的)
故障现象
读取磁盘中的数据时,磁盘设备发出异常声响。
访问磁盘中的某个文件时,反复读取且出错,提示文件损坏
对于新建立的分区无法完成格式化
系统使用该磁盘时频繁死机
解决思路
检测硬盘中是否存在坏道
修复硬盘,或更换新的硬盘
案例一、Mbr扇区故障模拟与故障排查:
- 添加新硬盘:
- 分区 fdisk /dev/sdb
- 格式化 mkfs.xfs /dev/sdb1
- 挂载 1)mkdir /bak 2)mount /dev/sdb1 /bak
2.备份mbr扇区:dd if=/dev/sda of=/bak/mbr.bak bs=512 count=1
3.模拟故障:dd if=/dev/zero of=/dev/sda bs=512 count=1
4.重启:观察现象
2.排除故障
1)挂系统盘,进入急救模式 3--2-1
2)重新挂载:①mkdir /aa ②mount /dev/sdb1 /aa
3)恢复:dd if=/aa/mbr.bak of=/dev/sda bs=512 count=1
4)exit
案例二、修复 GRUB 引导故障模拟与排查
1.模拟grub引导故障
- cp /boot/grub2/grub.cfg /boot/grub2/grub.cfg.bak
- rm -f /boot/grub2/grub.cfg
- reboot
2.解决grub引导故障
- 插入系统盘,光盘启动
- 进入急救模式
- chroot /mnt/sysimage
- cp /boot/grub2/grub.cfg.bak /boot/grub2/grub.cfg
- exit
- exit
案例三、模拟文件系统超级块损坏并修复
1.模拟故障:
破坏: 创建分区、格式化,先不要挂载
dd if=/dev/zero of=/dev/sdb1 bs=512 count=4
2.修复:xfs_repair /dev/sdb1
案例四、案例四、磁盘i节点耗尽故障及解决
1.模拟故障:
①添加一块硬盘,划分一个100M的分区,格式化,挂载到/data目录下
②查看i节点的数量
Df -i /data
③编辑脚本,循环创建文件,直到将i节点耗尽
vim killnode.sh
#!/bin/bash
i=1
while [ $i -le 前面查到的i节点数 ]
do
touch /data/file$i
let i++
done
④执行脚本
sh killnode.sh &
案例五、检查并修复磁盘坏道
badblocks -sv /dev/sdb
♥️关注,就是我创作的动力
♥️点赞,就是对我最大的认可
♥️这里是小刘,励志用心做好每一篇文章,谢谢大家