Congestión de los discos físicos en un cluster #vSAN.
¿Qué hace la comprobación y qué significa el estado de error?
¿Qué consecuencias podría tener la congestión reportada?
Si los servicios del estado de salud del cluster vSAN reportan congestión a nivel de discos físicos, hay que entenderlo.
¿Cuándo ocurre este reporte de salud?
Cuándo la velocidad de E/S de las capas inferiores no logran mantener la velocidad en las capas superior.
Verde para valores de congestión por debajo de 200.
Amarillo para valores de congestión entre 200 y 220.
Y rojo para valores superiores a 220.
¿Qué hace cuando el estado de saludo no es verde?
vSAN sigue utilizando los discos, cierto, pero el sistema se coloca en alerta y pasa a estar en un estado de rendimiento reducido que puede ser un potencial bomba de tiempo.
¿Qué pudiese estar pasando? Son varias las posibilidades:
1. Hardware con problemas físicos.
2. El firmware del control de almacenamiento no tiene un buen funcionamiento, revisar versiones.
3. Tamaño incorrecto a nivel de discos flash con respecto a los discos mecánicos. (para las cfg híbridas)
4. Revisar las queue depth, ya que pueden ser muy bajas.
¿Consecuencias o síntomas?
1. Degradación del rendimiento de las vm´s.
2. Algunas o todas las vm´s pueden dejar de responder.
3. Los hosts ESXi no responden.
A continuación los números de kb que pueden consultarse para más información: 2150012, 2071384 y, 2109255.