ICM / partners / Problemas Snapshots huérfanos en Nutanix
Problemas Snapshots huérfanos en Nutanix
5 septiembre 2020 | Ricard Forn
Hola mis queridos sufridores y sufridoras de problemas con snapshots en Nutanix, aquí va la segunda parte que teníamos pensada para ayudaros a abordar los problemas generados por snapshots en Nutanix. Hoy trataremos en esta entrada otro tipo de problemas con snapshots en Nutanix, más en concreto los snapshots huérfanos.
Antes de nada, recordaros que tenemos publicado en nuestro blog, la entrada de cómo tratar con los problemas de snapshots causados por software de terceros del tipo “Aged third-party backup snapshots present”.
Desgraciadamente para los snapshots huérfanos no hay alarma. Es una tarea que debes de automatizar o hacerla de forma regular si quieres mantener una buena salud en tu plataforma.
Nuevamente el panel web no nos aporta nada y nos sumergiremos en consola por ssh hacia la IP del cluster o de una CVM. Para saber si tenemos snapshots huérfanos, ejecutaremos un check específico que nos dará un output de “PASS” si no existen, o bien de “INFO” si existen:
ncc health_checks hypervisor_checks orphan_vm_snapshot_check
Snapshots huérfanos
En nuestros clusters no tenemos snapshots huérfanos para adjuntaros una captura con el output de INFO, es una tarea de mantenimiento que realizamos a menudo. Así que os dejamos una captura de PASS:

Si en vuestro caso tenéis snapshots huérfanos os aparecerá algo por el estilo:
Node x.x.x.x:
INFO: Found 3 orphan VM snapshot(s): [‘0477ee8f-60a0-4cdf-9516-9ba078a70920’, ‘cdeedda8-6ca2-42c4-ad7e-f2becdac779c’, ‘5b51683d-ef28-468a-a781-59dec3a950ca’]
Refer to KB 3752 (http://portal.nutanix.com/kb/3752) for details on orphan_vm_snapshot_check or Recheck with: ncc health_checks hypervisor_checks orphan_vm_snapshot_check
Con el comando acli snapshot.list podremos obtener el listado de todos los snapshots, su nombre y lo más importante, su nombre de VM:

Sabiendo el ID huérfano y la VM a la que pertenece, nos aseguramos en Prism que dicha VM no exista o que no tenga realmente dicho snapshot, y si realmente los snapshots son huérfanos, los eliminaremos.
acli snapshot.delete «Snapshot Name»
Una vez eliminados todos estos, os recomiendo pasar de nuevo el ncc health_check para validar que todo esté ok y obtener un PASS. Tu cluster te lo agradecerá si lo tienes bien limpio y cuidado…
Mil y una gracias por haber llegado hasta aquí. ¡Nos vemos en el próximo post!