写在开头:执行 StorCLI 命令通常需要 root 或管理员权限。创建、删除RAID等操作会破坏数据,生产环境中操作前务必反复确认 。文章中命令仅作提示,参数以实际为准。 1. 系统与控制器信息查看 用于了解阵列卡的总体状态、编号和基本配置。
PCI报错10:XX的代表riser2上的PCIE设备 PCI报错20:XX的代表riser1上的PCIE设备 PCI报错60:XX的代表riser3上的PCIE设备 PCI报错70:XX的代表slimline上的设备 PCI报错50:XX的代表slimline上的设备 </
XID 13: GR: SW Notify Error 常见原因:一般为用户应用程序故障。通常这是一个数组下标越界错误。也有可能是非法指令,非法寄存器等其他情况。 极少数情况下 会出现硬件故障或者软件错误导致XID 13 NVIDIA措施:在 cuda-gdb 或 Compute Sanitizer
开关机,重启 1. 查看开关机状态: ipmitool –H (BMC的管理IP地址) –I lanplus –U (BMC登录用户名) –P (BMC 登录用户名的密码) power status 2. 开机: ipmitool –H (BMC的管理IP地址) –I lanplus –U (BMC