ib网络状态探测
在 InfiniBand 网络中,Host Channel Adapter(HCA)是关键组件,了解其状态和配置对于网络管理和故障排查至关重要。以下是一些常用的命令,用于查询和管理 HCA 的状态和配置。
常用命令
-
ibstat
- 功能:显示 HCA 的基本状态信息,包括设备状态、端口状态、链路速度等。
- 用法:
ibstat
- 输出:包括 HCA 的名称、固件版本、端口状态(如
PORT_ACTIVE
)、最大和活动 MTU 等。
-
ibstatus
- 功能:提供 HCA 端口的详细状态信息。
- 用法:
ibstatus
- 输出:详细信息包括端口状态、活动速率、LID(本地标识符)、SM(子网管理器)状态等。
-
ibv_devinfo
- 功能:显示 HCA 的设备信息,包括设备属性、端口属性等。
- 用法:
ibv_devinfo
- 输出:提供有关 HCA 的详细信息,如设备名称、GUID、端口速率、最大 MTU 等。
-
ibqueryerrors
- 功能:查询 InfiniBand 网络中的错误统计信息,帮助识别网络问题。
- 用法:
ibqueryerrors
- 输出:显示网络中各端口的错误统计信息,如丢包、重传、CRC 错误等。
-
ibportstate
- 功能:查询和更改 HCA 端口的状态。
- 用法:
ibportstate <ca_name> <port_num>
- 输出:显示或修改指定端口的状态信息。
-
iblinkinfo
- 功能:显示 InfiniBand 网络拓扑和链路信息。
- 用法:
iblinkinfo
- 输出:提供有关网络拓扑的信息,包括链路状态、速率等。
使用示例
假设你想查看 HCA 的基本状态,可以使用 ibstat
命令:
ibstat
输出示例:
CA 'mlx5_0'
CA type: MT4115
Number of ports: 1
Firmware version: 16.23.1020
Hardware version: 0
Node GUID: 0x248a0703009b8e40
System image GUID: 0x248a0703009b8e40
Port 1:
State: Active
Physical state: LinkUp
Rate: 100
Base lid: 1
LMC: 0
SM lid: 2
Capability mask: 0x2651e848
通过这些命令,你可以有效地监控和管理 HCA 的状态和配置,确保 InfiniBand 网络的高效运行。