Este documento describe cómo identificar una barra cruzada defectuosa (Xbar) cuando un módulo está inactivo debido a una falla de sincronización Xbar en un switch Cisco Nexus serie 7000. El procedimiento de resolución de problemas para este problema implica la recopilación de datos, el análisis de datos y un proceso de eliminación para aislar el componente del problema.
Cisco recomienda que conozca la CLI del sistema operativo Cisco Nexus (NX-OS).
La información de este documento se basa en el switch Nexus de Cisco serie 7000 que ejecuta NX-OS versión 6.1(2), pero también puede funcionar con cualquier versión de NX-OS.
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
El módulo N7K-F248XP-25E está inactivo debido a una falla de sincronización Xbar al arrancar el módulo. Cuando el módulo se insertó en la ranura 1 del chasis, se apagó. Esto puede ocurrir por una de estas razones:
En el caso de una sospecha de falla de hardware en el módulo N7K-F248XP-25E, debe ver los registros para determinar si la razón de la falla se debe a un módulo defectuoso o a la falla de sincronización Xbar.
Para aislar aún más el problema en este ejemplo, el módulo se insertó en un slot diferente y se volvió activo como se esperaba. Esto indica que el módulo no es defectuoso, por lo que el problema es con el fabric Xbar o con el chasis.
Este registro de excepciones apareció cuando el módulo se apagó en la ranura 1:
show module internal exceptionlog module 1
********* Exception info for module 1 ********
exception information --- exception instance 1 ----
Module Slot Number: 1
Device Id : 88
Device Name : XbarComplex
Device Errorcode : 0x00000008
Device ID : 00 (0x00)
Device Instance : 00 (0x00)
Dev Type (HW/SW) : 00 (0x00)
ErrNum (devInfo) : 08 (0x08)
System Errorcode : 0x40240012 xbar sync failed during module bringup
(DevErr is LinkNum)
Error Type : Informational
PhyPortLayer : Unknown
Port(s) Affected : none
DSAP : 0 (0x0)
UUID : 0 (0x0)
Time : Thu Mar 20 15:55:19 2014
(Ticks: 532B0F67 jiffies)
exception information --- exception instance 2 ----
Module Slot Number: 1
Device Id : 88
Device Name : XbarComplex
Device Errorcode : 0x00000008
Device ID : 00 (0x00)
Device Instance : 00 (0x00)
Dev Type (HW/SW) : 00 (0x00)
ErrNum (devInfo) : 08 (0x08)
System Errorcode : 0x40240012 xbar sync failed during module bringup
(DevErr is LinkNum)
Error Type : Informational
PhyPortLayer : Unknown
Port(s) Affected : none
DSAP : 0 (0x0)
UUID : 0 (0x0)
Time : Thu Mar 20 15:53:12 2014
(Ticks: 532B0EE8 jiffies)
Según estos registros de excepciones, el problema se produce claramente con la Xbar o con el chasis en la ranura 1.
Para aislar aún más el problema, debe quitar cada Xbar individualmente mientras monitorea el módulo en la ranura 1 hasta que pueda encenderse sin problemas. Esto confirma que hay un problema con un módulo de fabric Xbar en particular, en cuyo caso se procedería con una autorización de devolución de mercancía (RMA) para el hardware defectuoso.
Sin embargo, se trata de un procedimiento largo que requiere una larga ventana de mantenimiento. Para encontrar la ranura exacta de estructura Xbar que causa el problema de sincronización con el módulo, puede continuar como se muestra aquí:
show system internal xbar event-history errors
-----------------------------------------------------
7) Event:E_DEBUG, length:67, at 384460 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_perform_error_action(1413): MTS_OPC_LC_INSERTED error 0x1
8) Event:E_DEBUG, length:104, at 384347 usecs after Thu Mar 20 15:55:19 2014
[102] send_exception_log_msg_to_lcm(1101): module 1 DevId 88 dev_err 0x8 sys
_err 0x40240012 err_type 0x4
9) Event:E_DEBUG, length:59, at 384343 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_mod_ac_error(221): Sync fail for module 1 link 8
10) Event:E_DEBUG, length:66, at 384341 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_mod_ac_error(210): Error for Slot 0 error_code 0x877660c
11) Event:E_DEBUG, length:62, at 384298 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_sync_seq_failed(1169): Sync fail for module 1 link 8
En estos registros, puede ver el mensaje Error de sincronización para el link 8 del módulo 1. A continuación, debe identificar la ranura de fabric con la que está asociado el Link 8. Para determinar esto, debe verificar el resultado del comando show system internal xbar sw:
show system internal xbar sw
Module in slot 1 (present = 0)
Dedicated X-link 255
rid 0x2000000 type 0 state 0 sub_type 0 node_id 0x0
sw_card_id 0x0 lc_node_addr 0x0 feature_bits 0x0
timer: hdl 0x86fcc20 rid 0x2000000 ev_id 0xffff timer_id 0x41a tim_type 0x2
Link_Info:: Num Links 10 max Edp 10
Link_num 0
is_synced 0 is_edp 0 num_sync_try 0
Link_num 1
is_synced 0 is_edp 0 num_sync_try 0
Link_num 2
is_synced 0 is_edp 0 num_sync_try 0
Link_num 3
is_synced 0 is_edp 0 num_sync_try 0
Link_num 4
is_synced 0 is_edp 0 num_sync_try 0
Link_num 5
is_synced 0 is_edp 0 num_sync_try 0
Link_num 6
is_synced 0 is_edp 0 num_sync_try 0
Link_num 7
is_synced 0 is_edp 0 num_sync_try 0
Link_num 8
is_synced 0 is_edp 0 num_sync_try 3
Link_num 9
is_synced 0 is_edp 0 num_sync_try 0
Link_Map:: Num Links 10 max Edp 10
Link_num 0
connected to fab [10.0] active_lnk 1
fi_to_mon 0 fi_to_use 0
Link_num 1
connected to fab [10.0] active_lnk 1
fi_to_mon 0 fi_to_use 0
Link_num 2
connected to fab [11.0] active_lnk 1
fi_to_mon 1 fi_to_use 1
Link_num 3
connected to fab [11.0] active_lnk 1
fi_to_mon 1 fi_to_use 1
Link_num 4
connected to fab [12.0] active_lnk 1
fi_to_mon 2 fi_to_use 2
Link_num 5
connected to fab [12.0] active_lnk 1
fi_to_mon 2 fi_to_use 2
Link_num 6
connected to fab [13.0] active_lnk 1
fi_to_mon 3 fi_to_use 3
Link_num 7
connected to fab [13.0] active_lnk 1
fi_to_mon 3 fi_to_use 3
Link_num 8
connected to fab [14.0] active_lnk 1
fi_to_mon 4 fi_to_use 4
Link_num 9
connected to fab [14.0] active_lnk 1
fi_to_mon 4 fi_to_use 4
En la salida, puede ver que Link_num 8 (Link 8) está conectado a fab [14.0] (Fabric Slot 14), que es Xbar 5.
Para identificar fab [14.0] (el fabric en la ranura 5), ingrese el comando show module :
show module
Xbar Ports Module-Type Model Status
--- ----- -------------------------------- ----------------- ------
4 0 Fabric Module 2 N7K-C7010-FAB-2 ok
Xbar MAC-Address(es) Serial-Num
--- -------------------------------------- ----------
1 NA JAF1739AQTP
2 NA JAF1739AJAA
3 NA JAF1739AQDG
4 NA JAF1739ATHG
5 NA JAF1739AQEF
En la salida del comando show module, puede ver el módulo de estructura Xbar en la ranura 5.
Ahora debe tener la identificación correcta del fabric que causó la falla de sincronización en el módulo en la ranura 1. En este ejemplo, el fabric se quitó de la ranura 5 y el módulo que estaba en la ranura 1 se inició sin ningún error. La barra Xbar defectuosa ahora puede ser reemplazada.
Revisión | Fecha de publicación | Comentarios |
---|---|---|
1.0 |
17-Jun-2015 |
Versión inicial |