Vmware esxi 查看硬盘健康状况
起因
硬盘掉盘 - -
使用自带的命令esxcli
列出所有硬盘
esxcli storage core device list
[root@localhost:~] esxcli storage core device list
t10.NVMe____INTEL_MEMPEK1W016GAL____________________PHBT83660BYP016D____00000001Display Name: Local NVMe Disk (t10.NVMe____INTEL_MEMPEK1W016GAL____________________PHBT83660BYP016D____00000001)Has Settable Display Name: trueSize: 13736Device Type: Direct-Access Multipath Plugin: NMPDevfs Path: /vmfs/devices/disks/t10.NVMe____INTEL_MEMPEK1W016GAL____________________PHBT83660BYP016D____00000001Vendor: NVMe Model: INTEL MEMPEK1W01Revision: K311SCSI Level: 6Is Pseudo: falseStatus: onIs RDM Capable: falseIs Local: trueIs Removable: falseIs SSD: trueIs VVOL PE: falseIs Offline: falseIs Perennially Reserved: falseQueue Full Sample Size: 0Queue Full Threshold: 0Thin Provisioning Status: yesAttached Filters: VAAI Status: unknownOther UIDs: vml.01000000005048425438333636304259503031364420202020494e54454c20Is Shared Clusterwide: falseIs SAS: falseIs USB: falseIs Boot Device: trueDevice Max Queue Depth: 127No of outstanding IOs with competing worlds: 32Drive Type: unknownRAID Level: unknownNumber of Physical Drives: unknownProtection Enabled: falsePI Activated: falsePI Type: 0PI Protection Mask: NO PROTECTIONSupported Guard Types: NO GUARD SUPPORTDIX Enabled: falseDIX Guard Type: NO GUARD SUPPORTEmulated DIX/DIF Enabled: falset10.NVMe____ZHITAI_TiPlus7100_2TB___________________C300F2DE03B728A4Display Name: Local NVMe Disk (t10.NVMe____ZHITAI_TiPlus7100_2TB___________________C300F2DE03B728A4)Has Settable Display Name: trueSize: 1953514Device Type: Direct-Access Multipath Plugin: NMPDevfs Path: /vmfs/devices/disks/t10.NVMe____ZHITAI_TiPlus7100_2TB___________________C300F2DE03B728A4Vendor: NVMe Model: ZHITAI TiPlus710Revision: ZTA2SCSI Level: 6Is Pseudo: falseStatus: onIs RDM Capable: falseIs Local: trueIs Removable: falseIs SSD: trueIs VVOL PE: falseIs Offline: falseIs Perennially Reserved: falseQueue Full Sample Size: 0Queue Full Threshold: 0Thin Provisioning Status: yesAttached Filters: VAAI Status: unsupportedOther UIDs: vml.0100000000433330305f463244455f303342375f32384134005a4849544149Is Shared Clusterwide: falseIs SAS: falseIs USB: falseIs Boot Device: falseDevice Max Queue Depth: 1023No of outstanding IOs with competing worlds: 32Drive Type: unknownRAID Level: unknownNumber of Physical Drives: unknownProtection Enabled: falsePI Activated: falsePI Type: 0PI Protection Mask: NO PROTECTIONSupported Guard Types: NO GUARD SUPPORTDIX Enabled: falseDIX Guard Type: NO GUARD SUPPORTEmulated DIX/DIF Enabled: false```
查看硬盘smart
信息
esxcli storage core device smart get -d <disk>
[root@localhost:~] esxcli storage core device smart get -d t10.NVMe____ZHITAI_TiPlus7100_2TB___________________C300F2DE03B728A4
Parameter Value Threshold Worst
---------------------------- ---------- --------- -----
Health Status OK N/A N/A
Media Wearout Indicator N/A N/A N/A
Write Error Count N/A N/A N/A
Read Error Count N/A N/A N/A
Power-on Hours 3855 N/A N/A
Power Cycle Count 6 N/A N/A
Reallocated Sector Count 0 99 N/A
Raw Read Error Rate N/A N/A N/A
Drive Temperature 48 90 N/A
Driver Rated Max Temperature N/A N/A N/A
Write Sectors TOT Count N/A N/A N/A
Read Sectors TOT Count 1875593000 N/A N/A
Initial Bad Block Count N/A N/A N/A
硬盘分析
以下是对从 ESXi 查询到的硬盘情况的详细分析:
第一块硬盘 (t10.NVMe____INTEL_MEMPEK1W016GAL____________________PHBT83660BYP016D____00000001)
-
基本信息 :
- 厂商与型号 :Vendor 为 NVMe,Model 为 INTEL MEMPEK1W01,是一款英特尔的 NVMe 固态硬盘。
- 容量 :Size 为 13736MB,大约 13.4GB 左右。
- 设备类型 :Direct-Access,表示可以直接访问的存储设备。
- 是否为 SSD :Is SSD 字段为 true,说明是固态硬盘,读写速度快,无机械结构,抗震性强。
-
路径与状态 :
- 设备路径 :Devfs Path 为 “/vmfs/devices/disks/t10.NVMe____INTEL_MEMPEK1W016GAL____________________PHBT83660BYP016D____00000001”,可通过此路径在 ESXi 系统中唯一标识和访问该硬盘。
- 状态 :Status 为 on,表示硬盘处于正常工作状态;Is Offline 为 false,进一步确认其在线可用;Is Boot Device 为 true,说明该硬盘是系统的启动盘。
-
高级特性与支持 :
- 多路径支持 :Multipath Plugin 为 NMP,即使用 ESXi 默认的多路径插件,可提供基本的多路径 I/O 功能,增强存储的可靠性和性能。
- VAAI 支持 :VAAI Status 为 unknown,意味着不确定是否支持 VAAI(vStorage APIs for Array Integration),VAAI 可以将一些存储任务卸载到存储阵列,提高虚拟机存储性能,unknown 可能是因为硬盘本身不支持或需要特定的存储阵列配置。
- 薄 provisioning :Thin Provisioning Status 为 yes,表示该硬盘支持精简置备,可按需分配存储空间,提高存储利用率。
第二块硬盘 (t10.NVMe____ZHITAI_TiPlus7100_2TB___________________C300F2DE03B728A4)
-
基本信息 :
- 厂商与型号 :Vendor 为 NVMe,Model 为 ZHITAI TiPlus710,是一款致态品牌的 NVMe 固态硬盘。
- 容量 :Size 为 1953514MB,即约 1.86TB 左右。
- 设备类型 :同样是 Direct-Access 类型的存储设备。
- 是否为 SSD :Is SSD 为 true,属于固态硬盘,具备高速读写特性。
-
路径与状态 :
- 设备路径 :Devfs Path 是 “/vmfs/devices/disks/t10.NVMe____ZHITAI_TiPlus7100_2TB___________________C300F2DE03B728A4”,用于在 ESXi 环境中唯一标识此硬盘。
- 状态 :Status 为 on,处于正常工作状态;Is Offline 同样为 false,在线可用;不过 Is Boot Device 为 false,表示该硬盘不是系统的启动盘。
-
高级特性与支持 :
- 多路径支持 :Multipath Plugin 使用 NMP,默认多路径插件提供基本的多路径功能。
- VAAI 支持 :VAAI Status 为 unsupported,不支持 VAAI 功能,可能在存储任务卸载等高级存储操作方面有所限制。
- 薄 provisioning :Thin Provisioning Status 为 yes,支持精简置备,能有效管理存储空间分配。
其他共同特性
- 协议与接口 :两块硬盘的 SCSI Level 都为 6,即支持 SCSI-6 协议,这是一种通用的存储设备接口协议,确保硬盘与 ESXi 主机之间的通信和数据传输遵循统一标准。
- 队列深度相关 :第一块硬盘的 Device Max Queue Depth 为 127,第二块为 1023,队列深度表示主机可同时向存储设备发送的 I/O 请求数量,第二块硬盘的队列深度更深,理论上在处理大量并发 I/O 请求时性能会更好。
- 健康状态(以第二块硬盘为例) :从
esxcli storage core device smart get
命令获取到的 S.M.A.R.T 信息显示,第二块硬盘的健康状态为 OK,通电时间为 3855 小时,通电次数为 6 次,温度为 48℃,未出现坏块(Reallocated Sector Count 为 0),读取扇区总数达 1875593000,整体运行状况良好,可放心使用。第一块硬盘未提供 S.M.A.R.T 详细数据,但从其 Is Boot Device 为 true 且状态正常可推测其健康状况也尚可。
总体分析与建议
- 该 ESXi 主机配备了两块 NVMe SSD,其中英特尔的 13.4GB SSD 作为启动盘,负责操作系统和关键启动文件的存储,致态的 1.86TB SSD 作为数据存储盘,可存放虚拟机磁盘文件、数据等。
- 第二块大容量硬盘队列深度高,适合运行对存储性能要求较高的虚拟机,如数据库服务器或高性能计算虚拟机。
- 虽然两块硬盘都支持精简置备,但在实际使用中要合理规划存储空间,避免过度分配导致的性能下降或存储资源紧张。
- 建议定期使用
esxcli storage core device smart get
命令检查硬盘的健康状态,特别是对于作为启动盘的第一块硬盘,及时发现潜在的硬件故障风险,保障 ESXi 主机的稳定运行。对于第二块硬盘,虽然 S.M.A.R.T 状态目前正常,也要持续关注其关键指标如通电时间、温度和坏块情况等,以预防可能出现的硬件问题。