El conjunto de documentos para este producto aspira al uso de un lenguaje no discriminatorio. A los fines de esta documentación, "no discriminatorio" se refiere al lenguaje que no implica discriminación por motivos de edad, discapacidad, género, identidad de raza, identidad étnica, orientación sexual, nivel socioeconómico e interseccionalidad. Puede haber excepciones en la documentación debido al lenguaje que se encuentra ya en las interfaces de usuario del software del producto, el lenguaje utilizado en función de la documentación de la RFP o el lenguaje utilizado por un producto de terceros al que se hace referencia. Obtenga más información sobre cómo Cisco utiliza el lenguaje inclusivo.
Cisco ha traducido este documento combinando la traducción automática y los recursos humanos a fin de ofrecer a nuestros usuarios en todo el mundo contenido en su propio idioma. Tenga en cuenta que incluso la mejor traducción automática podría no ser tan precisa como la proporcionada por un traductor profesional. Cisco Systems, Inc. no asume ninguna responsabilidad por la precisión de estas traducciones y recomienda remitirse siempre al documento original escrito en inglés (insertar vínculo URL).
Este documento describe el proceso de ejecución de la herramienta de comprobación de estado y actualización previa de Unified Computing System Manager (UCSM).
Cisco recomienda que tenga instalado Python 3.6 o posterior en el sistema.
Nota: Si está ejecutando el sistema operativo Windows, puede tener instalado Python y configurado el trayecto del Entorno.
Nota: No abra un caso TAC para problemas de Python/fallo al ejecutar el script. Consulte la sección de comandos de CLI para identificar manualmente el problema y abrir un caso de TAC por problema identificado.
Este documento no tiene restricciones específicas en cuanto a versiones de software y de hardware.
La información que contiene este documento se creó a partir de los dispositivos en un ambiente de laboratorio específico. Todos los dispositivos que se utilizan en este documento se pusieron en funcionamiento con una configuración verificada (predeterminada). Si tiene una red en vivo, asegúrese de entender el posible impacto de cualquier comando.
La herramienta de comprobación de UCSM es una utilidad para realizar autocomprobaciones proactivas en UCSM con el fin de garantizar su estabilidad y resistencia. Ayuda a automatizar una lista de comprobaciones de estado y previas a la actualización de los sistemas UCS para ahorrar tiempo a la hora de llevar a cabo las operaciones de mantenimiento y actualización de la infraestructura de UCS.
Nota: descargue y utilice siempre la última versión de la herramienta. Dado que la herramienta se mejora con frecuencia, cuando se utiliza una versión anterior, puede pasar por alto comprobaciones importantes.
Nota: este script es un script de uso gratuito y de mejor esfuerzo. Sin embargo, no puede identificar todos los problemas.
Paso 1. Descargar la última versión de Python desde Python Descargas
Paso 2. Utilice el proceso de instalación normal y haga clic en Install Now (el proceso recomendado) para descargar la configuración.
Nota: Asegúrese de marcar Add Python to PATH.
Paso 3. Navegue hasta el directorio en el que Python se instaló en el sistema.
Paso 4. Abra el símbolo del sistema y escriba el comando Python para verificar la instalación de Python.
Paso 5. Descargue la última versión del script de comprobación de estado desde aquí y guárdelo en una carpeta. Ahora, extraiga el archivo comprimido, como se muestra en la imagen.
Paso 6. Descargue y guarde los registros de asistencia técnica de UCSM más recientes en la carpeta creada, como se muestra en la imagen. Haga clic en este enlace para buscar los pasos para descargar el paquete de registro de UCSM: Generación de soporte técnico de UCSM.
Paso 7. Abra CMD y cd en la carpeta donde se encuentra UCSMTool.py y ejecute UCSMTool.py como se muestra en la imagen.
Paso 8. Introduzca la ruta del archivo en el que se encuentra el archivo de asistencia técnica de UCSM y seleccione la opción deseada.
1. Comprobación de estado de UCSM
2. Comprobación previa a la actualización
Paso 1. MacOS viene con Python predeterminado instalado, verifique la versión de Python instalada como se muestra:
Nota: En caso de que la versión de Python sea inferior a la 3.6, actualice a la versión 3.6 y posteriores.
Nota: Si la versión de Python es 3.6 o posterior, salte al Paso 5; de lo contrario, salte al Paso 2.
Paso 2. Descargue la última versión de Python desde https://www.python.org/downloads/macos/.
Paso 3. Utilice el proceso de instalación normal para completar/actualizar la instalación de Python.
Paso 4. Descargue desde aquí la última versión del script de comprobación de estado y guárdelo en una carpeta. Ahora, extraiga el archivo comprimido, como se muestra en esta imagen:
Paso 5. Descargue y guarde los registros de asistencia técnica de UCSM más recientes en la carpeta creada, como se muestra en esta imagen. Haga clic en el enlace para buscar los pasos para descargar el paquete de registro de UCSM: Generación de soporte técnico de UCSM.
Paso 6. Abra el terminal, busque el directorio donde tiene descargada la secuencia de comandos de comprobación de estado, ejecute python UCSMTool.py o python3UCSMTool.py como se muestra a continuación:.
Paso 7. Introduzca la ruta del archivo en el que se encuentra el archivo de soporte técnico de UCSM y seleccione la opción deseada para ejecutar la secuencia de comandos.
1. Comprobación de estado de UCSM
Estas comprobaciones las realiza UCSM-Healthchecktool:
Estado del clúster de UCSM HA: muestra el estado del clúster de las fabric interconectadas.
Estado del proceso PMON: muestra el estado de todos los procesos en Cisco UCS Manager.
Montaje del sistema de archivos: muestra la tabla de montaje.
Verifique el problema de tamaño de /var/ sysmgr: Verifica los usos de /var/ sysmgr.
Verifique el tamaño de /var/ tmp: Verifica si /var/ tmp utiliza.
6296 FI no responde después de un ciclo de alimentación, actualización de revisión de hardware: Módulo de interconexión de estructura de verificación y su número de revisión de hardware.
Fallos con gravedad mayor o crítica: informa si tiene alguna alerta mayor o crítica en UCS Manager.
Comprobar copia de seguridad disponible: compruebe si la copia de seguridad está disponible en UCS Manager.
Comprobación de certificado de llavero: Compruebe si el llavero ha caducado o es válido.
Solución alternativa de seguridad necesaria o no: verifique si se necesita o no una solución alternativa de seguridad mediante la verificación del modelo de FI y su versión.
Hardware obsoleto en Cisco UCS Manager versión 4.x: busque hardware obsoleto en Cisco UCS Manager versión 4.x.
Se ha encontrado hardware obsoleto para 3.1.x en adelante: compruebe si hay hardware obsoleto en Cisco UCS Manager versión 3.x
Compruebe si B200M4 se ha reiniciado debido a campos MRAID12G en blanco: compruebe si el servidor B200M4 tiene un S/N en blanco de la controladora RAID MRAID12G.
El cambio de UCSM 3.1 en la asignación de potencia máxima provoca un fallo en la detección de blades: verifica la política de alimentación configurada en UCS Manager.
Existencia de error de corrupción de bootflash código F1219: Verifique la existencia de corrupción de bootflash.
Compruebe si httpd no se inicia cuando se elimina el anillo de claves predeterminado: compruebe si se elimina el anillo de claves predeterminado.
Los FI de 3ª GENERACIÓN tienen estados de sistema de archivos no limpios-"Estado del sistema de archivos: limpiar con errores": Comprobar si hay errores en el sistema de archivos.
Comprobar si la instalación automática del servidor en la versión 4.0(4b) no activa la controladora SAS: compruebe la versión del firmware del host y la versión del ampliador SAS
Verifique que la actualización del firmware de la serie C se mantenga durante mucho tiempo en el proceso de "realizar un inventario del servidor" PNU OS Inventory: verifica el modelo del servidor y su versión para identificar si se da este problema.
Verifique el dominio de autenticación de UCSM que utiliza un punto o un guión: Verifique si el nombre del dominio de autenticación está configurado con un punto o caracteres de guión.
Error de autenticación local o de reserva: verifique el método de autenticación configurado para un modelo de FI determinado y verifique también su versión.
Comprobación de estado entre UCSM y UCS central: Compruebe si UCSManager está registrado con UCS Central
Grupos de pines LAN y SAN: verifique la configuración de pines LAN/SAN en su clúster y resalte para revisar su configuración antes de la actualización/cualquier actividad MW
Comprobación de las actividades pendientes presentes en UCSM: compruebe si hay actividades pendientes en el dominio de UCS Manager.
Comprobación del estado de IOM: Compruebe el estado general de los módulos de IOM.
Archivos de núcleo disponibles en la comprobación de UCSM: compruebe si se encuentra algún archivo de núcleo en un plazo de 60 días.
Posible configuración errónea de L2 desconectada: verifique si existe alguna configuración incorrecta en caso de que se configure la configuración de L2 desconectada.
Problema de inestabilidad de link de VIC 1400 y 6400: Verifique las condiciones presentes en este defecto
Verifique que los IOM 2304 se desconecten y se vuelvan a conectar durante la actualización del firmware: verifique el modelo de módulo de E/S e interconexión del fabric e identifique si existe algún problema potencial.
Comprobación del estado de DME: compruebe el estado de la base de datos de Data Management Engine (DME).
Número de interfaz activa y coincidencia de indicadores en FI: verifique el número de interfaces y la sesión de indicadores dinámicos
Comprobación de MTU Jumbo o Estándar: Identifique la configuración de MTU.
afrahmad@AFRAHMAD-M-C3RS ucsm_health_check-master $ python UCSMTool.py
UCS Health Check Tool 1.1
Enter the UCSM file path: /Users/afrahmad/Desktop/20190328180425_fabric-5410-1k08_UCSM.tar
Press 1 for UCSM Health Check
Press 2 for PreUpgrade Check
Enter your choice (1/2): 2
Enter the UCS Target Version [Ex:4.1(1x)]: 4.2(1i)
Log Extraction: [########################] COMPLETED
UCSM Version: 3.2(3h)A
Target Version: 4.2(1i)
Upgrade Path: 3.2(3) ==> 4.2(1i)
Summary Result:
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| SlNo | Name | Status | Comments |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 1 | UCSM HA Cluster State | PASS | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 2 | PMON Process State | PASS | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 3 | File System Mount | PASS | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 4 | Check for /var/sysmgr size issue | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 5 | Check for /var/tmp size issue | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 6 | 6296 FI unresponsive after power cycle, HW revision update | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 7 | Faults with Severity Major or Severity Critical | Found | Review the faults and Contact TAC, if needed |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 8 | Check Backup Available | No Backup | Please ensure to take backup, |
| | | | Refer this link: |
| | | | http://go2.cisco.com/UCSBackup |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 9 | Keyring Cert Check | PASS | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 10 | Safeshut Workaround Needed or Not | Not Needed | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 11 | Deprecated Hardware in Cisco UCS Manager Release 4.x | Found | Review the release notes to verify the hardware compatibility. |
| | | | Refer this link: |
| | | | http://go2.cisco.com/RN-4 |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 12 | Deprecated HW found for 3.1.x onwards | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 13 | Check for B200M4 reboot due to blank MRAID12G fields | Found | Contact TAC |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 14 | UCSM 3.1 Change in max power allocation causes blade discovery | Not Found | |
| | failure | | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 15 | Existence of bootflash corruption fault code F1219 | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 16 | Check for httpd fail to start when default keyring is deleted | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 17 | 3rd GEN FIs has unclean file system states-"Filesystem state: | Not Found | |
| | clean with errors" | | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 18 | Check for Server Auto-Install to 4.0(4b) Fails to Activate SAS | Not Found | |
| | Controller | | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 19 | Check for C-Series firmware upgrade stays long in process | Not Found | |
| | "perform inventory of server" PNU OS Inventory | | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 20 | Check UCSM Authentication Domain using a Period or Hyphen | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 21 | Local or fallback Authentication failure | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 22 | Health check between UCSM and UCS central | Not Found | UCS Manager is Not Registered |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 23 | LAN and SAN Pin Groups | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 24 | Checking Pending Activities Present in UCSM | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 25 | Health Check for IOM | PASS | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 26 | Core Files available in UCSM Check | Not Found | No core files were found in last 60 days |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 27 | Disjoint L2 potential misconfiguration | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 28 | VIC 1400 and 6400 Link Flap Issue | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 29 | Check 2304 IOMs disconnect and re-connect during firmware update | Not Found | |
| | step | | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 30 | Number of Interface up and Flogi Matching on FI | --- | Primary: |
| | | | FC Port Trunking Count: 0, |
| | | | Eth up Port: 5, |
| | | | Flogi Count: 12 |
| | | | Secondary: |
| | | | FC Port Trunking Count: 0, |
| | | | Eth up Port: 5, |
| | | | Flogi Count: 12 |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 31 | Jumbo or Standard MTU Check | NOT_FOUND | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
Faults with Severity Major:
F0207: Adapter ether host interface 3/3/1/2 link state: down
F0207: Adapter ether host interface 3/3/1/4 link state: down
F0207: Adapter ether host interface 3/3/1/3 link state: down
F0283: ether VIF 1153 on server 3 / 3 of switch B down, reason: Admin config change
F0479: Virtual interface 1153 link state is down
We would recommend Customers should complete the below prior to an upgrade:
a. Review firmware release notes
b. Review compatibility
c. Upload required images
d. Generate/Review UCSM show tech
e. Determine vulnerable upgrade bugs and complete pro-active workaround
f. Verify FI HA and UCSM PMON status
g. Generate all configuration and full state backups (right before upgrade)
h. Verify data path is ready (right before upgrade)
i. Disable call home (right before upgrade)
NOTE:
a. All reports and logs will be saved in the same location from where the script was executed.
b. Please visit the Summary Report/ Main Report to view all the Major and Critical Fault alerts.
Consejo: Para realizar una comprobación general del estado de su entorno UCS, Cisco TAC no proporciona este servicio. El equipo de atención al cliente de Cisco CX (anteriormente conocido como Advanced Services) dispone de un análisis de riesgos/depuración de errores que ofrece. Si necesita este tipo de servicio, póngase en contacto con el equipo comercial/de cuentas.
SSH a ambos Fabric Interconnects:
# show cluster extended-state, verify HA status is ready.
# connect local-mgmt ; # show pmon state, Verify the services are in running status.
# connect nxos ; # show system internal flash, Verify free size in /var/sysmgr and /var/tmp
# connect nxos ; # show module, verify HW revision number for 6296 fabric interconnects.
# show fault detail | include F1219, verify this fault code for bootflash corruption
# show iom health status, displays health of IOM
# show server status, verify the status of server.
# scope monitoring; # scope sysdebug; # show cores , verify if there are any core files.
# scope security; # scope keyring default; #show detail, verify details for default keyring, expiry etc.
# connect nxos; # show int br | grep -v down | wc –l, verify the number of active Ethernet interfaces.
# scope security; # show authentication, review the authentication type.
# connect nxos; # show flogi database, review the flogi database.
Revisión | Fecha de publicación | Comentarios |
---|---|---|
4.0 |
11-Jul-2024 |
Título actualizado, Introducción, Texto alternativo, Traducción automática, Requisitos de estilo, Puntuación y formato. |
3.0 |
28-Mar-2023 |
Dirección IP.
Título actualizado, Introducción, Texto alternativo, Traducción automática, Requisitos de estilo, Gerundios y formato. |
2.0 |
20-Dec-2021 |
Se ha añadido una nota adicional sobre el uso de la herramienta. |
1.0 |
16-Dec-2021 |
Versión inicial |