El conjunto de documentos para este producto aspira al uso de un lenguaje no discriminatorio. A los fines de esta documentación, "no discriminatorio" se refiere al lenguaje que no implica discriminación por motivos de edad, discapacidad, género, identidad de raza, identidad étnica, orientación sexual, nivel socioeconómico e interseccionalidad. Puede haber excepciones en la documentación debido al lenguaje que se encuentra ya en las interfaces de usuario del software del producto, el lenguaje utilizado en función de la documentación de la RFP o el lenguaje utilizado por un producto de terceros al que se hace referencia. Obtenga más información sobre cómo Cisco utiliza el lenguaje inclusivo.
Cisco ha traducido este documento combinando la traducción automática y los recursos humanos a fin de ofrecer a nuestros usuarios en todo el mundo contenido en su propio idioma. Tenga en cuenta que incluso la mejor traducción automática podría no ser tan precisa como la proporcionada por un traductor profesional. Cisco Systems, Inc. no asume ninguna responsabilidad por la precisión de estas traducciones y recomienda remitirse siempre al documento original escrito en inglés (insertar vínculo URL).
Este documento ddescribe cómo resolver el problema de inestabilidad de link de capa 1 en los switches Nexus 9000.
Cisco recomienda que esté familiarizado con el sistema operativo Cisco Nexus (NX-OS) y la arquitectura básica de Nexus antes de continuar con la información que se describe en este documento.
La información que contiene este documento se basa en las siguientes versiones de software y hardware.
La información que contiene este documento se creó a partir de los dispositivos en un ambiente de laboratorio específico. Todos los dispositivos que se utilizan en este documento se pusieron en funcionamiento con una configuración verificada (predeterminada). Si tiene una red en vivo, asegúrese de entender el posible impacto de cualquier comando.
Una inestabilidad de link es un problema de red en el que una interfaz física en un switch, como el Nexus 9000, alterna continuamente entre estar activa y no. Este comportamiento disruptivo puede degradar el rendimiento de la red, desestabilizar la red e interrumpir la comunicación, lo que puede causar importantes inconvenientes. Los flaps de link generalmente surgen de capas físicas defectuosas o problemas de sincronización de protocolos.
Los flaps de link desencadenados por protocolo ocurren cuando hay un problema con la sincronización del protocolo. Esto podría involucrar protocolos como el Protocolo de control de agregación de enlaces (LACP), Virtual Port-Channel y otros. El problema puede surgir de la configuración incorrecta del protocolo o de la pérdida de paquetes, lo que conduce a la inestabilidad del link. La supervisión regular y las actualizaciones de software oportunas pueden ayudar a evitar este tipo de inestabilidad de link.
Las inestabilidad de los enlaces también pueden provenir de la capa 1, la capa física de la red. A menudo, esto implica componentes físicos como cables e interfaces. Los cables dañados, sueltos o desgastados y las interfaces con mal funcionamiento pueden hacer que el link se inestable. Las inspecciones físicas y el mantenimiento regulares, incluidas las comprobaciones de cables y las pruebas de interfaz, pueden ayudar a identificar y corregir estos problemas antes de que provoquen aleteos de link.
Este artículo se centra en la resolución de problemas físicos de capa 1.
Las aletas de link se pueden identificar fácilmente a partir de los registros. El ejemplo muestra un evento de inestabilidad de link en el puerto E1/5, donde el puerto se desactiva y luego vuelve a activarse más tarde.
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-FOP_CHANGED: port-channel100: first operational port changed from Ethernet1/5 to none
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-PORT_DOWN: port-channel100: Ethernet1/5 is down
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel100 is down (No operational members)
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_BANDWIDTH_CHANGE: Interface port-channel100,bandwidth changed to 100000 Kbit
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_LINK_FAILURE: Interface Ethernet1/5 is down (Link failure)
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel100 is down (No operational members)
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-SPEED: Interface Ethernet1/5, operational speed changed to 10 Gbps
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-IF_DUPLEX: Interface Ethernet1/5, operational duplex mode changed to Full
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-IF_RX_FLOW_CONTROL: Interface Ethernet1/5, operational Receive Flow Control state changed to off
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-IF_TX_FLOW_CONTROL: Interface Ethernet1/5, operational Transmit Flow Control state changed to off
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-SPEED: Interface port-channel100, operational speed changed to 10 Gbps
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-IF_DUPLEX: Interface port-channel100, operational duplex mode changed to Full
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-IF_RX_FLOW_CONTROL: Interface port-channel100, operational Receive Flow Control state changed to off
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-IF_TX_FLOW_CONTROL: Interface port-channel100, operational Transmit Flow Control state changed to off
2024 Jan 21 05:28:02 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-PORT_UP: port-channel100: Ethernet1/5 is up
2024 Jan 21 05:28:02 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-FOP_CHANGED: port-channel100: first operational port changed from none to Ethernet1/5
2024 Jan 21 05:28:02 N9K-C93180YC-FX %ETHPORT-5-IF_BANDWIDTH_CHANGE: Interface port-channel100,bandwidth changed to 10000000 Kbit
2024 Jan 21 05:28:02 N9K-C93180YC-FX %ETHPORT-5-IF_UP: Interface Ethernet1/5 is up in mode access
2024 Jan 21 05:28:02 N9K-C93180YC-FX %ETHPORT-5-IF_UP: Interface port-channel100 is up in mode access
El Administrador de puertos Ethernet (Ethpm) es un proceso que administra interfaces Ethernet. El historial de eventos de Ethpm se puede utilizar para identificar la causa de una inestabilidad de link.
E1/5 experimenta un fallo de enlace a las 05:28:35, con la transición ethpm activada por ETH_PORT_FSM_EV_LINK_DOWN. Esto indica una inestabilidad de Capa 1.
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel100 is down (No operational members)
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_BANDWIDTH_CHANGE: Interface port-channel100,bandwidth changed to 100000 Kbit
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_LINK_FAILURE: Interface Ethernet1/5 is down (Link failure)
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel100 is down (No operational members)
N9K-C93180YC-FX# show system internal ethpm event-history interface e1/5
[143] 2024-01-21T05:26:02.100255000+00:00 [-] FSM:<Ethernet1/5> Transition:
Previous state: [ETH_PORT_FSM_ST_WAIT_BUNDLE_MEMBER_BRINGUP]
Triggered event: [ETH_PORT_FSM_EV_FIRST_BRINGUP_BUNDLE_MEMBER_DONE]
Next state: [ETH_PORT_FSM_ST_BUNDLE_MEMBER_UP]
[144] 2024-01-21T05:27:35.783495000+00:00 [-] FSM:<Ethernet1/5> Transition:
Previous state: [ETH_PORT_FSM_ST_BUNDLE_MEMBER_UP]
Triggered event: [ETH_PORT_FSM_EV_LINK_DOWN]
Next state: [FSM_ST_NO_CHANGE]
E1/8 entra en un estado de inicialización inactiva a las 07:40:07, con la transición ethpm activada por ETH_PORT_FSM_EV_EXTERNAL_REINIT_NO_FLAP_REQ. Esto indica una inestabilidad de link activada por el Protocolo de control de agregación de link (LACP).
2024 Jan 21 07:37:20 N9K-C93180YC-FX %ETHPORT-5-IF_UP: Interface port-channel200 is up in Layer3
2024 Jan 21 07:40:07 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel200 is down (No operational members)
2024 Jan 21 07:40:07 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-FOP_CHANGED: port-channel200: first operational port changed from Ethernet1/8 to none
2024 Jan 21 07:40:07 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-PORT_DOWN: port-channel200: Ethernet1/8 is down
2024 Jan 21 07:40:07 N9K-C93180YC-FX %ETHPORT-5-IF_BANDWIDTH_CHANGE: Interface port-channel200,bandwidth changed to 100000 Kbit
2024 Jan 21 07:40:07 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_INITIALIZING: Interface Ethernet1/8 is down (Initializing)
N9K-C93180YC-FX# show system internal ethpm event-history interface e1/8
[218] 2024-01-21T07:37:20.551880000+00:00 [-] FSM:<Ethernet1/8> Transition:
Previous state: [ETH_PORT_FSM_ST_WAIT_BUNDLE_MEMBER_BRINGUP]
Triggered event: [ETH_PORT_FSM_EV_FIRST_BRINGUP_BUNDLE_MEMBER_DONE]
Next state: [ETH_PORT_FSM_ST_BUNDLE_MEMBER_UP]
[219] 2024-01-21T07:40:07.104339000+00:00 [-] FSM:<Ethernet1/8> Transition:
Previous state: [ETH_PORT_FSM_ST_BUNDLE_MEMBER_UP]
Triggered event: [ETH_PORT_FSM_EV_EXTERNAL_REINIT_NO_FLAP_REQ]
Next state: [FSM_ST_NO_CHANGE]
Cisco ofrece una amplia gama de módulos ópticos para adaptarse a una amplia gama de velocidades, medios y distancias. Antes de conectar un enlace al Nexus 9000, asegúrese de que el SFP y el cable son compatibles con el software y el hardware actuales. Puede comprobarlo de las siguientes maneras:
Matriz de compatibilidad de óptica a dispositivo de Cisco
Matriz de interoperabilidad de óptica a óptica de Cisco
A partir de NX-OS 10.2.1, Platform Insights Engine (PIE) es compatible con todas las plataformas ToR y EoR de la escala de nubes. PIE es una aplicación de análisis de causa raíz en tiempo real en el switch.
Tres PIE pueden ayudarlo a resolver el problema de inestabilidad de link de Capa 1.
El PIE de inestabilidad de vínculo analiza los eventos de inestabilidad de vínculo publicados por los controladores de espacio de usuario (USD) y determina la causa raíz de una inestabilidad de vínculo. El PIE publica la información del análisis de la causa raíz al agente. Los eventos de inestabilidad de link son publicados por los USD (cliente PIE) cuando un link es inestable. Los USD recopilan todos los datos relevantes del ASIC y el USD que se requieren para el análisis de la causa raíz y publican los datos en el broker. El PIE de inestabilidad de link analiza los datos y llega a la causa raíz más probable para la inestabilidad.
El PIE de link descendente encuentra la causa raíz de un link que no aparece. El USD recopila datos sobre una interfaz cuando la interfaz está configurada para estar activa, pero el estado operativo de la interfaz no está activo. Estos datos se publican en la aplicación PIE. El PIE de link descendente se suscribe a estos eventos, recibe los datos del broker y los analiza para encontrar la causa raíz.
El PIE de óptica es un motor de monitoreo continuo que realiza un análisis de serie de tiempo de los datos DOM recopilados a intervalos regulares. Al realizar el seguimiento de varios parámetros en el DOM durante un período, el PIE llega a una métrica para describir el estado de la óptica para cada puerto óptico. La métrica es una perspectiva sobre el estado de tendencia de un transceptor óptico.
Para obtener más información, consulte este documento PIE:
Guía de Cisco Nexus serie 9000 NX-OS Platform Insights Engine, versión 10.2(x)
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-FOP_CHANGED: port-channel100: first operational port changed from Ethernet1/5 to none
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-PORT_DOWN: port-channel100: Ethernet1/5 is down
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel100 is down (No operational members)
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_BANDWIDTH_CHANGE: Interface port-channel100,bandwidth changed to 100000 Kbit
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_LINK_FAILURE: Interface Ethernet1/5 is down (Link failure)
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel100 is down (No operational members)
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-SPEED: Interface Ethernet1/5, operational speed changed to 10 Gbps
<snip>
2024 Jan 21 05:28:02 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-PORT_UP: port-channel100: Ethernet1/5 is up
N9K-C93180YC-FX# show pie interface ethernet 1/5 link-flap-rca
2024-01-21 05:27:35 Event Id: 00000068 Ethernet1/5 Source Id: 436209664 RCA Code: 41 >>>PIE event time
Reason: Link flapped/down due to Local Fault, check peer >>>PIE link flap reason
N9K-C93180YC-FX# show pie interface ethernet 1/5 transceiver-insights
2024-01-21 05:30:12 Event Id: 00000080 Event Class: xcvr DOM DB Event Interface: Ethernet1/5 Health Metric: --------GOOD------- Mod: 01
2024-01-21 05:28:12 Event Id: 00000072 Event Class: xcvr DOM DB Event Interface: Ethernet1/5 Health Metric: --------GOOD------- Mod: 01
2024 Jan 21 05:48:38 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-FOP_CHANGED: port-channel100: first operational port changed from Ethernet1/5 to none
2024 Jan 21 05:48:38 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-PORT_DOWN: port-channel100: Ethernet1/5 is down
2024 Jan 21 05:48:38 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel100 is down (No operational members)
2024 Jan 21 05:48:38 N9K-C93180YC-FX %ETHPORT-5-IF_BANDWIDTH_CHANGE: Interface port-channel100,bandwidth changed to 100000 Kbit
2024 Jan 21 05:48:38 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_LINK_FAILURE: Interface Ethernet1/5 is down (Link failure)
2024 Jan 21 05:48:38 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel100 is down (No operational members)
N9K-C93180YC-FX# show pie interface ethernet 1/5 link-down-rca
2024-01-21 05:48:48 Event Id: 00000197 Ethernet1/5 Source Id: 436209664 RCA Code: 16 >>>PIE event time
Reason: No PCS alignment detected. Please check Fec, speed, Autoneg configurations with peer >>>Physical layer failed
N9K-C93180YC-FX# show pie interface ethernet 1/5 transceiver-insights
2024-01-21 05:50:12 Event Id: 00000199 Event Class: xcvr DOM DB Event Interface: Ethernet1/5 Health Metric: ********BAD******** Mod: 01
2024-01-21 05:48:12 Event Id: 00000187 Event Class: xcvr DOM DB Event Interface: Ethernet1/5 Health Metric: --------GOOD------- Mod: 01
En función de la salida de PIE, se recomienda sustituir el componente potencialmente defectuoso y continuar con la supervisión. Si la inestabilidad del link persiste, se necesita una prueba de intercambio para restringir la parte defectuosa. Se puede realizar una prueba de intercambio cambiando un componente a la vez mientras se mantiene todo lo demás sin cambios. En última instancia, el link se estabiliza después de que el componente defectuoso específico ha sido intercambiado.
Para las versiones de software NX-OS anteriores a la 10.2(1), la compatibilidad con PIE no está disponible. Se requieren varios pasos manuales para verificar la inestabilidad de link de capa 1.
Muestra todos los eventos de vínculo del módulo adjunto. El tiempo de rebote se refiere a la duración que espera una interfaz antes de notificar al supervisor que un link está cayendo. Durante este período, la interfaz espera para ver si el link vuelve a activarse. Esto se utiliza para determinar si el link se ha caído o está experimentando una inestabilidad menor.
N9K-C93180YC-FX# attach module 1
module-1# show system internal port-client link-event
*************** Port Client Link Events Log ***************
---- ------ ----- ----- ------
Time PortNo Speed Event Stsinfo
---- ------ ----- ----- ------
Jan 21 05:48:38 2024 00122142 Ethernet1/5 ---- DOWN Link down debounce timer stopped and link is down
Jan 21 05:48:37 2024 00993003 Ethernet1/5 ---- DOWN Link down debounce timer started(0x40e50006)
Jan 21 05:45:14 2024 00432606 Ethernet1/5 10G UP SUCCESS(0x0)
Estos eventos proporcionan información detallada sobre cada evento de vínculo.
N9K-C93180YC-FX# attach module 1
module-1# show hardware internal tah link-events fp-port 5
324) Jan 21 05:48:37 2024 uSec 992843: Fp 5 : tahusd_isr.c #8469
Port Down with an ASIC interrupt
------------- ASIC MAC/PCS/Serdes REGS (Mac Channel 0) -------------
Link flapped due to Local Fault, check peer >>>Local Fault means the local device detected the issue on the receive path.
>>>Remote Fault means a Local Fault is detected across the link.
Intr Regs 00:0x0000, 01:0x0000, 02:0x0000, 03:0x0010, 07:0x0000, 11:0x0000, 15:0x0000
sts2.bercount : 0x0f00 sts2.erroredblocks : 0x0000
bercounthi : 0x0000 erroredblockhi : 0x0000
counters0.syncloss : 0x0001 counters0.blocklockloss: 0x0001
counters1.highber : 0x0000 counters1.vlderr : 0x0000
counters2.unkerr : 0x0012 counters2.invlderr : 0x0000
Código de error |
Explicación |
|
sts2.erroredblocks |
Cuenta los bloques con errores (bits de orden superior). |
|
sts2.bercount |
Cuenta los encabezados de sincronización incorrectos (bits de orden inferior). |
|
bercounthi |
Cuenta los encabezados de sincronización incorrectos (bits de orden superior). |
|
erroredblockhi |
Cuenta los bloques con errores (bits de orden superior). |
|
counters0.syncloss |
Pérdida de sincronización |
|
counters0.blocklockloss |
Bloquear pérdida de bloqueo |
|
counters1.highber |
BER alto |
|
counters1.vlderr |
Error válido |
|
counters2.unkerr |
Error Desconocido |
|
counters2.invlder |
Error no válido |
En este resultado se incluyen varios datos de Small Form-Factor Pluggable (SFP). Si algún valor cae fuera del rango aceptable en el diagnóstico SFP, entonces el SFP se considera un componente potencialmente dañado y necesita ser reemplazado. En este ejemplo, todo está en buen orden.
N9K-C93180YC-FX# show interface e1/5 transceiver details
Ethernet1/5
transceiver is present
type is 10Gbase-SR >>>SFP type
name is CISCO-OPLINK >>>SFP vendor
part number is TPP4XGDS0CCISE2G
revision is 02
serial number is OPMXXXXXXXX >>>SFP SN
nominal bitrate is 10300 MBit/sec >>>SFP bitrate
Link length supported for 50/125um OM2 fiber is 82 m
Link length supported for 62.5/125um fiber is 26 m
Link length supported for 50/125um OM3 fiber is 300 m
cisco id is 3
cisco extended id number is 4
cisco part number is 10-2415-03
cisco product id is SFP-10G-SR >>>SFP PID
cisco version id is V03
SFP Detail Diagnostics Information (internal calibration)
----------------------------------------------------------------------------
Current Alarms Warnings
Measurement High Low High Low
----------------------------------------------------------------------------
Temperature 36.52 C 75.00 C -5.00 C 70.00 C 0.00 C
Voltage 3.28 V 3.63 V 2.97 V 3.46 V 3.13 V
Current 6.61 mA 12.00 mA 0.50 mA 11.50 mA 1.00 mA
Tx Power -2.70 dBm 1.99 dBm -11.30 dBm -1.00 dBm -7.30 dBm
Rx Power -2.40 dBm 1.99 dBm -13.97 dBm -1.00 dBm -9.91 dBm
Transmit Fault Count = 0
----------------------------------------------------------------------------
Note: ++ high-alarm; + high-warning; -- low-alarm; - low-warning
peer side information is snipped.
Si todo parece correcto con las comprobaciones anteriores, es necesario efectuar una prueba de cambio para reducir la pieza defectuosa. Se puede realizar una prueba de intercambio cambiando un componente a la vez mientras se mantiene todo lo demás sin cambios. Con el tiempo, el enlace se estabiliza después de que el componente defectuoso específico haya sido intercambiado.
Guía de configuración de interfaces Nexus 9000
Guía del motor de perspectivas de la plataforma NX-OS Nexus serie 9000
Revisión | Fecha de publicación | Comentarios |
---|---|---|
1.0 |
31-Jan-2024 |
Versión inicial |