服务器性能监控管理方法及工具
服务器是组织数据中心的主干,无论是优化的用户体验,还是管理良好的资源,服务器都能为您完成所有工作,保持服务器随时可用和可访问对于面向业务的应用程序和服务以最佳水平运行至关重要。
理想的服务器性能需要主动监控物理和虚拟服务器,如VMware、Hyper-V、Nutanix集群,以及构成服务器运行状况的组件,以及使用服务器性能监控工具进行监控,换句话说,监控服务器性能和服务器监控指标对于任何企业保持运营并防止生产力和业务损失都至关重要。
什么是服务器监控管理
服务器管理被定义为通过使用各种工具或方法进行持续监控来管理服务器基础结构并监督其性能的行为,服务器性能管理有助于提高关键业务应用程序的敏捷性,旨在优化物理和虚拟服务器的性能。
什么是服务器性能
服务器性能是衡量服务器中发生的操作的运行状况和功能的指标,服务器根据用户的请求,在一天内处理多个数据。若要处理这些请求,需要理想的服务器性能。
为什么需要服务器性能管理
跟踪服务器性能对于保持服务器正常运行时间至关重要;管理资源并防止服务器延迟问题,这进一步有助于确保更快的 I/O 操作并避免潜在的徒劳停机时间。
如何衡量服务器性能
服务器性能可以通过跟踪关键服务器性能指标来衡量,例如服务器可用性、响应时间、服务器延迟、硬件指标、进程计数、服务性能等,所有这些指标的理想性能确保了最佳的服务器性能。
关键服务器性能指标
下面列出了为确保理想的服务器运行状况而要监控的关键服务器性能指标:
- 可用性:可用性是指服务器在没有任何中断的情况下启动并运行,从而确保最长的网络正常运行时间,监控服务器的正常运行时间和可用性对于确保服务器和网络的平稳运行非常重要。
- 响应时间:将数据包从源设备传输到目标设备所花费的时间称为响应时间,跟踪响应时间对于防止服务器和网络延迟并提供丰富的最终用户体验至关重要。
- 网络性能:网络性能由关键的服务器性能指标决定,例如 CPU 利用率、内存利用率、磁盘利用率、设备分区详细信息等,需要实时监控这些指标,以保持最佳的服务器性能。
- 进程计数:记录服务器上运行的进程数对于保持服务器效率和确保 QoS(服务质量)非常重要。
- 服务性能:后台运行服务(如TCP端口服务,MS Exchange服务,MS SQL服务)的性能对于服务器的运行状况和性能至关重要,因此,监控服务的可用性和性能对于防止不可预见的服务器崩溃或停机至关重要。
- 硬件指标:硬件故障或硬件性能指标(如风扇速度、功率、温度、电池)的波动可能会影响服务器性能,因此,跟踪硬件运行状况成为必要。
服务器性能监视的方法
- 关联服务器性能指标的监控数据
- 启用多渠道警报
- 配置补救脚本以自动进行故障排除
- 生成智能报告
关联服务器性能指标的监控数据
对服务器性能中断进行故障排除不仅需要监控它们,还需要关联它们的性能数据,以分析是否存在连锁反应(指标中的中断会影响另一个指标)。例如,CPU 使用率的峰值可能是由于内存不足,这需要管理员将 CPU 和内存性能相关联,而不是仅仅依靠检查 CPU 温度、风扇速度等,全面了解所有服务器性能指标对于检查服务器性能监控至关重要。
启用多渠道警报
监控网络与将如何处理监控数据一样重要,管理员无法全天候的登录监控工具并查看仪表板,因此需要有一个自动警报系统,以便在超出定义的阈值级别时触发警报,这些警报应通过不同的通知渠道进行通知,以便管理员按照自己的节奏工作。
配置补救脚本以自动进行故障排除
为了帮助进行故障排除,服务器性能监视工具应该能够了解过去的网络问题、其历史行为及其明确原因,以帮助更快地解决故障,管理员还应该能够配置补救脚本,以便在出现特定问题时自动进行故障排除。
生成智能报告
监测数据应以报告的形式存储,以便能够访问历史数据模式和增长趋势,这有助于预测存储问题和规划容量,这有助于管理员决定是否可以升级资源或购买存储,从而避免不可预见的网络停机或业务损失。
服务器性能监控管理工具
随着当今许多应用程序和服务迁移到数据中心,虚拟化和服务器整合带来了新的管理挑战。OpManager 的服务器性能监控管理工具为IT管理员提供了一个单一的管理控制台,用于跨Windows、Linux、Unix、VMware、Hyper-V、Nutanix和Xen服务器平台对物理和虚拟服务器进行深入的可见性和控制。
通过以下方式帮助执行实时服务器性能监控管理:
- 物理和虚拟服务器性能监控
- 检测和解决服务器性能问题
- 增强的服务器管理活动
- 自动执行服务器性能管理
- 使用 SLA 进行服务器性能管理
- 服务器性能管理和容量规划与报告
物理和虚拟服务器性能监控
主动监控服务器的可用性和响应时间对于服务器管理至关重要,OpManager 网络和服务器性能管理软件,可以主动监控多个关键服务器性能指标,如CPU利用率、磁盘利用率、分区内存利用率等,以及监控进程和服务。OpManager的故障监控包括基于阈值的警报和服务器可用性和运行状况通知。
- VMware ESX 服务器和客户机操作系统
- 应用程序服务器、Active Directory、SQL 和 Exchange 服务器
- Hyper-V 服务器
- Xen 服务器
- Nutanix 资产(集群/主机/虚拟机)
检测和解决服务器性能问题
服务器监控管理工具可检测服务器问题并对其进行故障排除,否则这些问题会影响企业/最终用户。OpManager会事先检测服务器性能问题,如CPU繁忙时间、可用内存不足等,并发送智能且可操作的警报来补救它们。可以自动执行网络故障排除过程。高级警报甚至可以将故障单记录到集成的支持系统中,确保您在用户受到影响之前识别潜在问题,简化了服务器性能监控的整个过程。
增强的服务器管理活动
使用服务器性能管理工具,管理员可以简化监控和管理服务器性能的过程,如下所示。
- Ping 和 Traceroute:服务器快照页面中的 ping 工具可用于直接 ping 服务器,以监控其可用性和正常运行时间。Traceroute 允许管理员识别网络路径,并帮助区分服务器或网络的问题。
- 远程服务器连接:远程访问服务器对于设置 VPN、运行版本控制系统、备份数据和其他 IT 任务非常有用。在Web客户端中远程访问服务器,管理员可以使用 SNMP、WMI、Telnet/SSH 凭据和远程桌面连接直接连接到服务器,也可以通过 HTTP 或 HTTPS 连接连接到服务器上运行的特定 Web 服务,(仅限 IE)。
- 停机时间计划程序:停机时间调度程序有助于定期安排服务器上的维护活动,此功能还可以扩展到其他网络设备,如交换机、路由器等。在计划的维护期间,会智能地停止对该特定设备的监控。
- 测试监视器:允许管理员为关键性能指标(如CPU利用率、内存利用率、分区详细信息等)配置服务器性能监控器。测试监视器验证该指标是否正在被监控,并提供所监控指标的值,它还列出了未从服务器接收数据时的可能原因。
- 操作系统监控: 允许管理员全面监控桌面和服务器操作系统。这包括跟踪关键系统指标、服务状态、进程状态、事件日志、性能计数器、应用程序(Exchange、MSSQL 等)和服务(Active Directory、DHCP 等),支持监控Windows、Linux、Unix和Solaris操作系统。
自动执行服务器性能管理
服务器管理工具的作用包括修复服务器故障和日常维护任务,这些任务本质上是重复和费力的。自动执行此类管理任务可以帮助 IT 管理员节省时间和精力,从而最大限度地提高工作效率。支持近80个操作,这些操作可以通过其工作流自动执行。
一些可以使用工作流自动执行的服务器性能管理任务包括:
- 放置/退出服务器维护。
- 停止/重新启动/挂起虚拟机。
- 刷新虚拟服务器中的数据存储。
- 停止/关闭/重新启动来宾操作系统。
- 按磁盘读/写/内存/CPU 使用率列出服务器进程。
- 启动/停止/暂停/重新启动 Windows 服务。
- 执行脚本。
使用 SLA 进行服务器性能管理
可以根据设备所促进的服务对设备进行分组,并确保每个业务服务都满足SLA。针对下降的SLA发出警报,从直观的业务服务地图中,管理员可以向下钻取和排除问题设备故障,以快速恢复SLA。
服务器性能管理和容量规划与报告
通过多个关于可用性、资源利用率、故障事件等的开箱即用的服务器性能报告,OpManager为您的下一次容量添加提供了现成的信息。此外,管理员可以创建自己的自定义报告,例如,关于数据中心中所有服务器的可用性和响应时间的日终报告,并每天自动将这些报告发送到您的邮箱。