Introducción
Este documento describe escenarios comunes de solución de problemas para la implementación de clústeres Hyperflex a través de Intersight.
Prerequisites
Requirements
Cisco recomienda que tenga conocimiento sobre estos temas:
- Intersight
- Implementación de clústeres Hyperflex
Componentes Utilizados
Este documento no tiene restricciones específicas en cuanto a versiones de software y de hardware.
La información que contiene este documento se creó a partir de los dispositivos en un ambiente de laboratorio específico. Todos los dispositivos que se utilizan en este documento se pusieron en funcionamiento con una configuración verificada (predeterminada). Si tiene una red en vivo, asegúrese de entender el posible impacto de cualquier comando.
Antecedentes
El flujo de trabajo del instalador de Intersight sigue la tarea presentada en el gráfico para implementar un clúster de hiperflexión:
Nombre de tarea |
Definición |
PreparePreClusterInfoTask |
Genera archivos de configuración que contienen la información necesaria para implementar el clúster (por ejemplo, ruta del archivo de configuración o archivo YAML de software). |
ServerConfigurationValidationTask |
Valida la configuración del servidor UCS para garantizar que tiene la configuración de hardware y firmware necesaria (por ejemplo, validación de tamaño de disco/PID, NIC correctas, etc.). |
PreConfigurationValidationTask |
Valida la configuración de red antes de que se inicie la configuración del servidor (por ejemplo, DNS, NTP, disponibilidad del vCenter, comprobación de IP duplicada) |
PrepararTareaRepoImagenLocal |
Descarga imágenes de software (controlador VM OVA, paquetes hxdp) en el almacén de imágenes local. Esta tarea sólo se incluye en el flujo de trabajo si se ejecuta en el entorno de dispositivo conectado. |
TareaConfiguraciónServidor |
Realiza la configuración necesaria en los servidores UCS. En el caso de las implementaciones conectadas a FI, esto implica la creación y asociación de los perfiles de servicio. |
HipervisorEsxConfigurationTask |
Configura la parte de la red en el hipervisor. Esto incluye el uso de Serial Over Lan para agregar los enlaces ascendentes al vSwitch de administración y configura la dirección IP, el nombre de host y la configuración DNS/NTP. |
PreDeployValidationTask |
Realiza validaciones antes de que se inicie la implementación del clúster. Las validaciones incluyen comprobaciones de disponibilidad de la red y la comprobación de que los nodos no forman parte ya de otro clúster. |
PrepareHypervisorDeploymentTask |
prepara el hipervisor para la configuración de la máquina virtual (VM) del controlador. Obtiene información del host de ESXi y garantiza que se han establecido los parámetros adecuados del sistema operativo. |
TareaRedHipervisor |
Configura la parte de red en el host de ESXi. Incluye la configuración de los diferentes vSwitches/grupos de puertos en el host que se requieren para que el clúster funcione. |
HipervisorSoftwareActualizarTarea |
Actualiza el software en el hipervisor, que consta de los VIB necesarios en el host si es necesario. |
HipervisorDatastoreTask |
Crea el almacén de datos para la máquina virtual del controlador, si es necesario. |
ImplementarVmControladorHiperflex |
Implementa el controlador de almacenamiento OVA en el hipervisor, si es necesario. |
ConfigVmTask |
Configura la porción de red en la VM del controlador, que incluye la configuración de los parámetros requeridos y las redes de datos/administración. |
ImplementarSoftwareVmTask |
Instala paquetes HXDP en las VM del controlador. |
CollectNodeInfoTask |
Recopila información del nodo, como UUID e IP. |
RecopilarTareaDatosInventario |
Envía datos de inventario a las VM del controlador. |
CrearTareaValidaciónClúster |
Realiza validaciones para garantizar que la máquina virtual del controlador esté lista para unirse al clúster. Incluye comprobaciones de MTU y verifica que los servicios de almacenamiento estén listos. |
CrearTareaDeClúster |
Crea el clúster de almacenamiento y toma la máquina virtual del controlador para unir todos los nodos del clúster. |
PostInstallHostConfig |
Configura el host después de implementar el clúster. Incluye el cambio de la contraseña de ESXi a la nueva contraseña proporcionada en el perfil de clúster de Hyperflex. |
PostInstallStorageControllerVmConfig |
Configura las VM del controlador después de implementar el clúster, incluye el cambio de contraseña de la VM del controlador a la nueva contraseña proporcionada en el perfil de clúster de Hyperflex |
ClústerReclamaciónAutomáticaTarea |
Reclama el clúster de HyperFlex a la cuenta de usuario de Intersight. |
Problema
Estos son los errores comunes que puede encontrar en la implementación del clúster:
Errores/advertencias de validación:
- IP duplicadas (error en la misma fabric interconectada, advertencia si se superponen globalmente)
- Creación de clústeres de 2 nodos
- 2 para el factor de replicación elegido (se recomienda un factor de replicación de datos de 3)
Validación en tiempo de ejecución:
- DNS, NTP inalcanzable
- vCenter no está disponible o las credenciales son incorrectas
- Direcciones IP de administración ya en uso
Errores de implementación:
- Mismas VLAN de datos para dos clústeres diferentes en el mismo dominio L2 (switch de enlace ascendente)
- Enlace cruzado
- Error de configuración de IP de ESXi (debido a credenciales de ESXi incorrectas)
Solución
Según la tarea que falle y el error encontrado, puede realizar las acciones sugeridas:
DNS/NTP no accesible
Validator_NTP_List, Status Code: 9 (FAILED), Message: There are no reachable NTP servers from list
Acción: compruebe la dirección IP; si no es correcta, modifique la política y reinicie el flujo de trabajo.
vCenter no accesible
"vCenter reachability and credential check : vCenter server is not reachable or invalid vCenter credentials."
Acción: compruebe las credenciales de IP/ vCenter; si no son correctas, modifique la política y reinicie el flujo de trabajo.
IP duplicada
“IP address x.x.x.x already in use. Please verify there are no duplicate IPs.”
Acción: compruebe si la dirección IP ya está en uso; si es así, modifique la política y reinicie el flujo de trabajo.
Error de conexión al host
failed in Task: 'Connection to host' with Error: 'Host(x.x.x.x) is not reachable via device connector.
Please check the VLAN ID, IP address and gateway settings.'
Acción: verifique la VLAN/ IP/ Gateway, si es incorrecta modifique la política y reinicie el flujo de trabajo.
Reclamación automática errónea
"failed to claim the HyperFlex device connector.
This cluster requires continued connectivity to Intersight to ensure Fault Tolerance is maintained.
The cluster cannot tolerate failures until this step is completed. Please check the cluster connectivity to Intersight and perform a manual claim. "
Acción: reclamar el clúster de HyperFlex descrito en el procedimiento de reclamación de dispositivos y reiniciar el flujo de trabajo.
Error al configurar la asociación del perfil de servidor
failed in Task: 'Failed to Configure Server Profile Association
Acción:
La configuración de IP de ESXi se realiza mediante el acceso a la consola a través de CIMC Serial Over LAN. A veces, CIMC SoL no logra que la consola entre en la indicación de inicio de sesión. Compruebe la consola CIMC en ESXi mediante KVM, reinicie CIMC y el flujo de trabajo.
Error en la tarea: supervisar el arranque del SO
Configuring CIMC server: failed in Task: 'Failed to Configure Server Profile Association.' with Error: 'failed in Task: 'Monitor OS boot' with Error: 'OS Installation has failed'\"}}}}'
Acción:
- Asegúrese de que la contraseña de raíz de ESXi es correcta
- Para la instalación inicial, asegúrese de comprobar la contraseña predeterminada de fábrica.
- Para volver a instalar, asegúrese de desmarcar la contraseña predeterminada de fábrica.
- Verifique si existe una falla de acceso a SoL.
- Compruebe si el conector del dispositivo se ha desconectado durante el arranque del SO.
Si se trata de una instalación nueva, asegúrese de que la contraseña proporcionada no sea la contraseña predeterminada (Cisco123), incluso después de que el botón de opción contraseña predeterminada de fábrica esté activado.
El resultado de esta acción es que el instalador puede iniciar sesión en ESXi, pero no puede establecer la contraseña porque la seguridad de la contraseña predeterminada es débil
Error en la tarea: verificar OVA contra Sha1
Deploying Storage Controller VM on ESXi host: Failed in Task: “Verify OVA against Sha1"
Acción:
- Compruebe si ESXi no tiene DNS configurado.
- Compruebe si la subred IP de gestión de ESXi está bloqueada para el acceso de intersección.
Error en la tarea: agregar host al clúster de vCenter
failed in Task: Add host to vCenter Cluster with Error: Try adding host manually to vCenter and retry. failed to add the host x.x.x.x with 3 attempts
Acción:
La versión de vCenter debe ser superior o igual a todos los hosts del clúster. Actualice vCenter a una versión superior o igual a ESXi o reduzca ESXi a una versión estable inferior.
Error en la tarea: error en la configuración de VM del controlador de almacenamiento de red
failed in Task: 'Check Network for Storage Controller VM Configuration Result' with Error: 'Configure networking failed with error: Error while connecting to ESXi host. Please check the connection and retry'
Acción:
El servidor API EXSI no responde a tiempo de forma ocasional.
- Verifique el estado del servicio alojado para asegurarse de que se está ejecutando.
- Reinicie ESXi y vuelva a intentar la implementación.
Error de flujo de trabajo debido a problemas de MTU
failed in Task: 'Verify Storage Cluster' with Error: 'id: 2 entityRef: id: x.x.x.x name: x.x.x cluster message: Could not ping x.x.x.x with MTU 9000 during failover test.
Verify the VLAN and MTU on the upstream switch is correct prior to continuing. severity: warning'
Acción:
La trama Jumbo no está habilitada en todas las trayectorias; cuando la trama Jumbo está habilitada, el valor MTU 9216 debe configurarse en el switch de link ascendente. Asegúrese de que la MTU esté configurada en tramas jumbo en todas las trayectorias y reinicie el flujo de trabajo
Error en la tarea: copia de paquetes de software en la máquina virtual del controlador de almacenamiento
failed in Task: 'Copying Software Packages to Storage Controller VM(outbound)' with Error: 'Unexpected failure during module execution.
Acción:
- Asegúrese de que haya conectividad de red desde SCVM a Intersight.
- Verifique que los puertos requeridos estén permitidos en la red.
- Consulte los links de comprobación previa a la instalación para conocer los requisitos de red.
Información Relacionada