Python 实时获取Linux服务器信息
在进行服务器监控、运维管理时,实时获取服务器信息至关重要。特别是在 Linux 环境下,我们常常需要获取系统的运行状态、资源占用情况以及硬件信息。如果你是运维人员、开发者或是正在做自动化运维任务的人,那么如何高效地实时获取 Linux 服务器的信息就是你必须掌握的技能。你知道如何使用 Python 来获取这些信息吗?
在 Linux 服务器中,我们经常需要获取诸如 CPU 使用率、内存占用、磁盘空间等实时数据。如何使用 Python 高效地获取这些信息,避免繁琐的手动检查,是很多运维自动化脚本的核心。下面,我们就来看看 Python 是如何做到这一点的。
性能测试中需要关注Linux服务器哪些数据?
在进行 Linux 服务器的性能测试时,需要关注多个关键指标以确保系统能够高效、稳定地运行。以下是一些常见的性能测试指标及其重要性:
Python 提供了强大的库和工具,使得我们能够高效、准确地获取 Linux 服务器的信息
要实现实时获取 Linux 服务器的信息,Python 提供了一些优秀的库,例如 psutil
、os
和 subprocess
。通过这些库,我们可以方便地获取系统的 CPU、内存、磁盘、网络等资源的使用情况。以下是一些常见需求的实现方法。
-
使用 psutil 库获取系统信息
psutil
是一个跨平台的库,用于获取系统和进程的各种信息。通过它,我们可以获取 CPU、内存、磁盘、网络等资源的使用情况。安装 psutil 库:
pip install psutil
获取 CPU 使用率:
import psutil # 获取CPU使用率,默认是获取每秒平均使用率 cpu_usage = psutil.cpu_percent(interval=1) print(f"CPU Usage: {cpu_usage}%")
获取内存使用情况:
memory_info = psutil.virtual_memory() print(f"Memory Usage: {memory_info.percent}%")
获取磁盘空间使用情况:
disk_info = psutil.disk_usage('/') print(f"Disk Usage: {disk_info.percent}%")
获取网络接口的状态:
net_info = psutil.net_io_counters() print(f"Bytes Sent: {net_info.bytes_sent}, Bytes Received: {net_info.bytes_recv}")
1. CPU 使用率
用户时间 (User Time): 应用程序实际使用 CPU 的时间。
系统时间 (System Time): 内核和系统调用使用 CPU 的时间。
空闲时间 (Idle Time): CPU 空闲的时间。
等待 I/O 时间 (I/O Wait Time): CPU 等待 I/O 操作完成的时间。
2. 内存使用情况
总内存 (Total Memory): 系统总的物理内存。
已用内存 (Used Memory): 当前正在使用的内存。
可用内存 (Available Memory): 可供新进程使用的内存。
缓存 (Cache): 用于文件系统的缓存。
缓冲区 (Buffers): 用于块设备 I/O 的缓冲区。
交换空间 (Swap Space): 用于虚拟内存的磁盘空间。
交换使用 (Swap Usage): 当前正在使用的交换空间。
3. 磁盘 I/O
读取速率 (Read Rate): 每秒从磁盘读取的数据量。
写入速率 (Write Rate): 每秒写入磁盘的数据量。
IOPS (Input/Output Operations Per Second): 每秒的 I/O 操作次数。
等待队列长度 (Average Queue Length): 平均等待 I/O 操作的请求数。
4. 网络带宽
发送速率 (Send Rate): 每秒发送的数据量。
接收速率 (Receive Rate): 每秒接收的数据量。
网络错误 (Network Errors): 网络传输中的错误数。
丢包率 (Packet Loss): 数据包丢失的比例。
5. 进程信息
进程数 (Number of Processes): 系统中运行的进程数量。
僵尸进程 (Zombie Processes): 已经终止但其父进程尚未回收其资源的进程。
负载平均值 (Load Average): 过去 1 分钟、5 分钟和 15 分钟内的系统负载平均值。
6. 文件系统
挂载点 (Mount Points): 文件系统的挂载点。
使用率 (Usage): 每个挂载点的使用百分比。
剩余空间 (Free Space): 每个挂载点的剩余空间。
7. 系统日志
系统日志 (System Logs): 如 /var/log 目录下的日志文件,记录系统事件和错误信息。
8. 系统启动时间和响应时间
启动时间 (Boot Time): 系统启动所需的时间。
响应时间 (Response Time): 系统对请求的响应时间。
9. 上下文切换 (Context Switches)
上下文切换次数 (Context Switches): 每秒发生的上下文切换次数。
10. 中断 (Interrupts)
中断次数 (Interrupts): 每秒处理的硬件中断次数。
性能测试工具
为了收集这些数据,可以使用多种工具,包括但不限于:
top, htop: 实时查看系统资源使用情况。
vmstat, iostat, mpstat: 统计系统性能数据。
dstat: 多合一系统资源统计工具。
sar (System Activity Reporter): 收集、报告和保存系统活动信息。
nmon (Nigel's Monitor): 实时监控系统性能。
netstat, ss, iptraf, iftop: 网络流量监控。
tcpdump, Wireshark: 网络抓包分析。
iotop, iostat: 磁盘 I/O 监控。
sysdig, strace, ltrace: 系统调用跟踪。
示例命令
以下是一些常用的命令示例,可以帮助你获取上述指标:
# 查看 CPU 使用情况
top -b -n 1 | grep "Cpu(s)"
# 查看内存使用情况
free -h
# 查看磁盘 I/O
iostat -x 1 1
# 查看网络带宽
ifstat 1 1
# 查看进程信息
ps aux --sort=-%cpu
# 查看文件系统使用情况
df -h
# 查看系统日志
tail -f /var/log/syslog
# 查看上下文切换和中断
vmstat 1 1
以下代码作为辅助,大家如果有兴趣写平台的话,可以用到
python 每1秒获取一次mac电脑的cup、内存、磁盘,并每分钟记录一次数据到指定excel文件中
import psutil
import time
from openpyxl import Workbook
from openpyxl.utils import get_column_letter
# 初始化 Excel 工作簿
wb = Workbook()
ws = wb.active
ws.title = "System Monitor"
ws.append(["Timestamp", "CPU (%)", "Memory (%)", "Disk (%)"])
# 记录数据的时间间隔(秒)
record_interval = 60
data_points = []
def get_system_info():
# 获取 CPU 使用率
cpu_percent = psutil.cpu_percent(interval=1)
# 获取内存使用情况
memory_info = psutil.virtual_memory()
memory_percent = memory_info.percent
# 获取磁盘使用情况
disk_info = psutil.disk_usage('/')
disk_percent = disk_info.percent
return cpu_percent, memory_percent, disk_percent
def record_data_to_excel(data_points):
for data_point in data_points:
ws.append(data_point)
# 计算平均值
if data_points:
avg_cpu = sum(point[1] for point in data_points) / len(data_points)
avg_memory = sum(point[2] for point in data_points) / len(data_points)
avg_disk = sum(point[3] for point in data_points) / len(data_points)
# 将平均值写入 Excel
ws.append(["Average", avg_cpu, avg_memory, avg_disk])
# 保存 Excel 文件
wb.save("system_monitor.xlsx")
try:
while True:
# 获取当前时间戳
timestamp = time.strftime("%Y-%m-%d %H:%M:%S")
# 获取系统信息
cpu_percent, memory_percent, disk_percent = get_system_info()
# 打印当前系统信息
print(f"Timestamp: {timestamp}, CPU: {cpu_percent}%, Memory: {memory_percent}%, Disk: {disk_percent}%")
# 将数据点添加到列表中
data_points.append([timestamp, cpu_percent, memory_percent, disk_percent])
# 每分钟记录一次数据到 Excel 文件
if len(data_points) >= record_interval:
record_data_to_excel(data_points)
data_points = [] # 清空数据点列表
# 等待 1 秒
time.sleep(1)
except KeyboardInterrupt:
# 如果用户中断程序(例如按 Ctrl+C),保存剩余的数据点
if data_points:
record_data_to_excel(data_points)
print("Monitoring stopped. Data saved to system_monitor.xlsx")
代码说明
初始化 Excel 工作簿:
创建一个新的 Excel 工作簿,并设置工作表名称为 "System Monitor"。
在第一行添加列标题。
定义 get_system_info 函数:
使用 psutil 库获取 CPU 使用率、内存使用率和磁盘使用率。
定义 record_data_to_excel 函数:
将数据点列表中的数据写入 Excel 文件。
计算 CPU、内存和磁盘使用率的平均值,并将这些平均值写入 Excel 文件。
保存 Excel 文件。
主循环:
每秒获取一次系统信息并打印。
将获取的数据添加到 data_points 列表中。
当 data_points 列表中的数据点数量达到 60 个时(即每分钟),调用 record_data_to_excel 函数将数据写入 Excel 文件,并清空 data_points 列表。
使用 time.sleep(1) 使程序暂停 1 秒,以实现每秒获取一次数据。
异常处理:
如果用户通过按 Ctrl+C 中断程序,保存剩余的数据点并退出程序。
运行脚本
将上述代码保存到一个 Python 文件中(例如 system_monitor.py),然后在 Linux 终端中运行它:
python3 system_monitor.py
这将开始每秒获取一次系统信息,并每分钟将数据记录到 system_monitor.xlsx 文件中。每分钟结束时,还会计算并记录 CPU、内存和磁盘使用率的平均值。如果需要停止监控,可以按 Ctrl+C。
请确保你有适当的权限来执行脚本,并且安装了所有必需的库。如果遇到任何问题,请告诉我!
以下为代码运行后生成的文件内容
随着企业对自动化运维和实时监控的需求日益增加,如何高效地获取和监控服务器信息成为了 DevOps 及运维工程师的日常工作。Python,作为一门简洁而功能强大的编程语言,已成为开发人员和运维人员自动化管理服务器的首选工具。通过使用 Python 脚本实时获取和分析 Linux 服务器的信息,企业能够更加高效地管理和优化基础设施。
通过 Python,我们能够快速且高效地实时获取 Linux 服务器的信息,从而进行资源监控、性能优化和故障排查。这不仅能大大提高运维效率,也能帮助开发人员在开发阶段及时发现潜在问题,避免后期生产环境中出现突发故障。
“运维的核心是实时,实时的核心是效率;Python,让实时监控变得轻松。”