El conjunto de documentos para este producto aspira al uso de un lenguaje no discriminatorio. A los fines de esta documentación, "no discriminatorio" se refiere al lenguaje que no implica discriminación por motivos de edad, discapacidad, género, identidad de raza, identidad étnica, orientación sexual, nivel socioeconómico e interseccionalidad. Puede haber excepciones en la documentación debido al lenguaje que se encuentra ya en las interfaces de usuario del software del producto, el lenguaje utilizado en función de la documentación de la RFP o el lenguaje utilizado por un producto de terceros al que se hace referencia. Obtenga más información sobre cómo Cisco utiliza el lenguaje inclusivo.
Cisco ha traducido este documento combinando la traducción automática y los recursos humanos a fin de ofrecer a nuestros usuarios en todo el mundo contenido en su propio idioma. Tenga en cuenta que incluso la mejor traducción automática podría no ser tan precisa como la proporcionada por un traductor profesional. Cisco Systems, Inc. no asume ninguna responsabilidad por la precisión de estas traducciones y recomienda remitirse siempre al documento original escrito en inglés (insertar vínculo URL).
Este documento explica cómo resolver problemas de crashes del Procesador del switch (SP) de Supervisor Engine del switch Cisco Catalyst 6000/6500 Series y Route Processor (RP) Multilayer Switch Feature Card (MSFC).
No hay requisitos específicos para este documento.
La información de este documento se basa en los Cisco Catalyst 6000/6500 Series Switch Supervisors y en los módulos MSFC.
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
Un Catalyst 6500/6000 con un registro de configuración SP que permite la interrupción, por ejemplo 0x2, y que recibe una señal de interrupción de la consola ingresa al modo de diagnóstico ROMmon. El sistema parece fallar.
Este ejemplo de resultado del switch indica que el switch ingresó al modo de diagnóstico ROMmon desde una señal de interrupción de la consola del procesador del switch.
Nota: El registro de configuración RP es 0x2102.
6500_IOS#show version Cisco Internetwork Operating System Software IOS (tm) c6sup2_rp Software (c6sup2_rp-PS-M), Version 12.1(13)E14, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) Technical Support: http://www.cisco.com/techsupport Copyright (c) 1986-2004 by Cisco Systems, Inc. Compiled Tue 30-Mar-04 01:56 by pwade Image text-base: 0x40008C00, data-base: 0x417A6000 ROM: System Bootstrap, Version 12.1(4r)E, RELEASE SOFTWARE (fc1) BOOTLDR: c6sup2_rp Software (c6sup2_rp-PS-M), Version 12.1(13)E14, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) 6500_IOS uptime is 31 minutes Time since 6500_IOS switched to active is 31 minutes System returned to ROM by power-on (SP by abort at PC 0x601061A8) System image file is "slot0:c6sup12-ps-mz.121-13.E14" cisco Catalyst 6000 (R7000) processor with 227328K/34816K bytes of memory. Processor board ID SAD053701CF R7000 CPU at 300Mhz, Implementation 39, Rev 2.1, 256KB L2, 1024KB L3 Cache Last reset from power-on X.25 software, Version 3.0.0. Bridging software. 1 Virtual Ethernet/IEEE 802.3 interface(s) 192 FastEthernet/IEEE 802.3 interface(s) 18 Gigabit Ethernet/IEEE 802.3 interface(s) 381K bytes of non-volatile configuration memory. 16384K bytes of Flash internal SIMM (Sector size 512K). Configuration register is 0x2102
La solución es volver a configurar el registro de configuración y volver a cargar el sistema. Complete estos pasos:
6500_IOS#config terminal
Enter configuration commands, one per line. End with CNTL/Z.
6500_IOS(config)#config-register 0x2102
6500_IOS(config)#end
6500_IOS#show bootvar BOOT variable = slot0:c6sup12-ps-mz.121-13.E14,1 CONFIG_FILE variable = BOOTLDR variable = Configuration register is 0x2102
6500_IOS#remote command switch show bootvar
6500_IOS-sp#
BOOT variable = slot0:c6sup12-ps-mz.121-13.E14,1
CONFIG_FILE variable =
BOOTLDR variable =
Configuration register is 0x2 (will be 0x2102 at next reload)
6500_IOS#reload
Nota: Puede ejecutar el comando copy running-config startup-config en este momento para guardar la configuración. Sin embargo, este paso no es necesario porque la configuración del registro de configuración no forma parte de la configuración de inicio o ejecución.
Mientras se realiza un procedimiento de recuperación de contraseña en un Supervisor Engine 720, el switch puede fallar mientras se interrumpe para obtener acceso a la consola del RP.
*** System received a Software forced crash *** signal= 0x17, code= 0x24, context= 0x4269f6f4 PC = 0x401370d8, Cause = 0x3020, Status Reg = 0x34008002
Utilice este procedimiento de solución alternativa de recuperación de contraseña para evitar que el Supervisor se caiga cuando realiza una recuperación de contraseña:
00:00:03: %OIR-6-CONSOLE: Changing console ownership to route processor
Consejo: Refiérase a Combinaciones Estándar de Secuencias de Teclas de Interrupción Durante la Recuperación de Contraseña para ver las combinaciones de teclas.
Este problema se documenta con el ID de bug de Cisco CSCec36997 (sólo clientes registrados).
Los switches Cisco Catalyst 6000/6500 pueden recargarse inesperadamente debido a una causa desconocida. El resultado del comando show version muestra un mensaje de error similar:
System returned to ROM by unknown reload cause - suspect boot_data[BOOT_COUNT] 0x0, BOOT_COUNT 0, BOOTDATA 19 (SP by power-on)
Este problema se documenta con el ID de bug de Cisco CSCef80423 (sólo clientes registrados). Actualice el switch a la última versión del software Cisco IOS no afectada por el error para resolver este problema.
Este mensaje indica que el firmware del módulo especificado ha detectado un error de paridad. El sistema reajusta automáticamente el módulo para recuperarse del error. También aparece un archivo crashinfo en este módulo. El mensaje de error puede deberse a una falla transitoria o de hardware. Si el mensaje de error aparece una vez, se trata de un problema transitorio. El sistema lo recupera automáticamente. El CPO_ECC puede identificar el síntoma de la paridad en la memoria caché. El ECC que representa el error de paridad ha sido corregido por el propio sistema.
Estos son los dos tipos de errores de paridad:
Mar 9 12:12:24.427 GMT: %PM_SCP-SP-1-LCP_FW_ERR: Module 6 is experiencing the following error: Pinnacle #0 PB parity error. Tx path. Status=0x0042Se ha demostrado mediante estudios que los errores de paridad de software son 10 a 100 veces más frecuentes que los errores de paridad de hardware. Por lo tanto, Cisco recomienda encarecidamente que espere a que se produzca un error de paridad de hardware antes de sustituir cualquier elemento. Esto reduce en gran medida el impacto en su red.
El mensaje indica que el controlador del sistema ha detectado un error. Recargue el dispositivo. Si este mensaje vuelve a aparecer, reemplace la memoria defectuosa o la tarjeta MSFC.
%SYSTEM_CONTROLLER-3-FATAL: An unrecoverable error has been detected. The system is being reset. %Software-forced reload
Cuando falla una bandeja de ventilador o se apaga una fuente de alimentación, los switches Catalyst de Cisco que ejecutan la versión 12.1(19)E1 del software del IOS de Cisco podrían interrumpir los módulos de Supervisor. El problema se documenta con el ID de bug de Cisco CSCeb51698 (sólo clientes registrados). Actualice el switch a la versión de Cisco IOS no afectada por este defecto.
Si sospecha que el switch se ha iniciado por su cuenta, ejecute el comando show version para verificar el tiempo de actividad del switch, que es el tiempo transcurrido desde el último reinicio. Ejecute el comando show log para ver el historial de reinicio, como muestra este ejemplo. Vea este resultado del comando para ver si hay alguna excepción registrada.
sup2a> (enable)show version WS-C6506 Software, Version NmpSW: 6.3(10) !--- Output is suppressed. Uptime is 7 days, 4 hours, 27 minutes
sup2a> (enable)show log Network Management Processor (ACTIVE NMP) Log: Reset count: 1 Re-boot History: Jan 06 2003 10:35:56 0 Bootrom Checksum Failures: 0 UART Failures: 0 Flash Checksum Failures: 0 Flash Program Failures: 0 Power Supply 1 Failures: 0 Power Supply 2 Failures: 0 Swapped to CLKA: 0 Swapped to CLKB: 0 Swapped to Processor 1: 0 Swapped to Processor 2: 0 DRAM Failures: 0 Exceptions: 0 Loaded NMP version: 6.3(10) Software version: slot0:cat6000-sup2.6-3-10.bin Reload same NMP version count: 1 Last software reset by user: 1/6/2003,10:35:35 EOBC Exceptions/Hang: 0 Heap Memory Log: Corrupted Block = none
Esta salida del comando show log no muestra excepciones de software. La indicación del último reinicio del switch es Jan 06 2003. El tiempo de reinicio coincide en el campo Last software reset.
Este resultado del comando show log muestra una excepción que se registró en el momento del último reinicio.
esc-cat5500-b (enable)show log Network Management Processor (STANDBY NMP) Log: Reset count: 38 Re-boot History: Oct 14 2001 05:48:53 0, Jul 30 2001 06:51:38 0 Jul 28 2001 20:31:40 0, May 16 2001 21:15:39 0 May 02 2001 01:02:53 0, Apr 26 2001 21:42:24 0 Apr 07 2001 05:23:42 0, Mar 25 2001 02:48:03 0 Jan 05 2001 00:21:39 0, Jan 04 2001 4:54:52 0 Bootrom Checksum Failures: 0 UART Failures: 0 Flash Checksum Failures: 0 Flash Program Failures: 0 Power Supply 1 Failures: 4 Power Supply 2 Failures: 0 Swapped to CLKA: 0 Swapped to CLKB: 0 Swapped to Processor 1: 3 Swapped to Processor 2: 0 DRAM Failures: 0 Exceptions: 1 Loaded NMP version: 5.5(7) Reload same NMP version count: 3 Last software reset by user: 7/28/2001,20:30:38 Last Exception occurred on Oct 14 2001 05:47:29 ... Software version = 5.5(7) Error Msg: PID = 86 telnet87 EPC: 80269C44 !--- Output is suppressed.
Si su switch muestra tal excepción de software, ejecute el comando dir bootflash: , que muestra el dispositivo bootflash MSFC (procesador de ruta [RP]) y el comando dir slavebootflash: para verificar si se produjo un crash del software. El resultado de esta sección muestra que crashinfo se ha registrado en la memoria flash de inicialización RP. Asegúrese de que la información de desperfecto que ve es la más reciente.
cat6knative#dir bootflash: Directory of bootflash:/ 1 -rw- 1693168 Jul 24 2002 15:48:22 c6msfc2-boot-mz.121-8a.EX 2 -rw- 183086 Aug 29 2002 11:23:40 crashinfo_20020829-112340 3 -rw- 20174748 Jan 30 2003 11:59:18 c6sup22-jsv-mz.121-8b.E9 4 -rw- 7146 Feb 03 2003 06:50:39 test.cfg 5 -rw- 31288 Feb 03 2003 07:36:36 01_config.txt 6 -rw- 30963 Feb 03 2003 07:36:44 02_config.txt 31981568 bytes total (9860396 bytes free)
El comando dir sup-bootflash: muestra el dispositivo bootflash del Supervisor Engine. También puede ejecutar el comando dir slavesup-bootflash: para mostrar el dispositivo bootflash del Supervisor Engine en espera. Esta salida muestra crashinfo grabada en el dispositivo bootflash del Supervisor Engine.
cat6knative11#dir sup-bootflash: Directory of sup-bootflash:/ 1 -rw- 14849280 May 23 2001 12:35:09 c6sup12-jsv-mz.121-5c.E10 2 -rw- 20176 Aug 02 2001 18:42:05 crashinfo_20010802-234205 !--- Output is suppressed.
Si el resultado del comando indica que se produjo una caída del software en el momento en que sospechó que el switch se reinició, comuníquese con el Soporte Técnico de Cisco. Proporcione el resultado del comando show tech-support y el comando show logging, así como el resultado del archivo crashinfo.
Si un módulo equipado con tarjeta de reenvío distribuido (DFC) se ha restablecido por sí solo sin recarga de usuario, puede comprobar la memoria flash de inicialización de la tarjeta DFC para ver si se ha producido un fallo. Si hay disponible un archivo de información de desperfecto, puede encontrar la causa del desperfecto. Ejecute el comando dir dfc#module#-bootflash: para verificar si hay un archivo de información de desperfecto y cuándo se escribió. Si el reinicio de DFC coincide con la marca de tiempo crashinfo, ejecute el comando more dfc#module#-bootflash:filename . O ejecute el comando copy dfc#module#-bootflash:filename tftp para transferir el archivo a través de TFTP a un servidor TFTP.
cat6knative#dir dfc#6-bootflash: Directory of dfc#6-bootflash:/ -#- ED ----type---- --crc--- -seek-- nlen -length- -----date/time------ name 1 .. crashinfo 2B745A9A C24D0 25 271437 Jan 27 2003 20:39:43 crashinfo_ 20030127-203943
Después de tener el archivo crashinfo disponible, recopile el resultado del comando show logging y del comando show tech y comuníquese con el Soporte Técnico de Cisco para obtener más ayuda.
Cuando se inicia desde un dispositivo que no aparece en la tabla de dispositivos, se produce un desperfecto con el módulo Supervisor. Actualice el switch a Cisco IOS Software Release 12.2(18r)SX05 o posterior.
Mensajes de error:
%CONST_DIAG-2-HM_SUP_CRSH: Supervisor crashed due to unrecoverable errors, Reason: Failed TestSPRPInbandPing %CONST_DIAG-2-HM_SUP_CRSH: Standby supervisor crashed due to unrecoverable errors, Reason: Failed TestSPRPInbandPing
Causas y resoluciones:
Los switches Cisco Catalyst 6500/6000 pueden recargarse inesperadamente durante el proceso de inicialización. El registro de desperfectos puede mostrar mensajes del sistema similares a estos:
Desde el módulo Supervisor activo:
%SYS-SP-2-MALLOCFAIL: Memory allocation of 320000 bytes failed from 0x40BCF26C, alignment 8 Pool: Processor Free: 75448 Cause: Not enough free memory Alternate Pool: None Free: 0 Cause: No Alternate pool -Process= "CEF process", ipl= 0, pid= 240 -Traceback= 40280AB4 40288058 40BCF274 40BE5660 40BE5730 4029A764 4029A750 %L2-SP-4-NOMEM: Malloc failed: L2-API Purge/Search failed. size req. 512 SP: EARL Driver:lyra_purge_search:process_push_event_list failed %SCHED-SP-2-SEMNOTLOCKED: L2 bad entry (7fff/0) purge proc attempted to unlock an unlocked semaphore -Traceback= 402C202C 4058775C 4058511C 40587CB8
Desde el módulo Supervisor en espera:
%SYS-SP-STDBY-2-MALLOCFAIL: Memory allocation of 2920 bytes failed from 0x40174088, alignment 8 Pool: Processor Free: 9544 Cause: Memory fragmentation Alternate Pool: None Free: 0 Cause: No Alternate pool -Process= "DiagCard2/-1", ipl= 0, pid= 154 -Traceback= 4016F7CC 40172984 40174090 4063601C 40636584 4062D194 4062ABD8 4062A9EC 4017E0B0 4017E09C %L2-SP-STDBY-4-NOMEM: Malloc failed: L2-API Purge/Search failed. size req. 512 %SCHED-SP-STDBY-2-SEMNOTLOCKED: L2 bad entry (7fff/0) purge proc attempted to unlock an unlocked semaphore -Traceback= 4018A300 403F0400 403EDD7C 403F0A48 SP-STDBY: EARL Driver:lyra_purge_search:process_push_event_list failed %SYS-SP-STDBY-2-MALLOCFAIL: Memory allocation of 1400 bytes failed from 0x409928B4, alignment 8 Pool: Processor Free: 7544 Cause: Memory fragmentation Alternate Pool: None Free: 0 Cause: No Alternate pool -Process= "CEF LC Stats", ipl= 0, pid= 138 -Traceback= 4016F7CC 40172984 409928BC 409C5EEC 4098A5EC
Desde Cisco IOS Software Release 12.2(17d)SXB, Supervisor Engine 2 necesita una DRAM mínima de 256MB. Si su módulo Supervisor tiene una DRAM de 128 MB, entonces para resolver este problema, actualice la memoria a 256 MB o más. Consulte Release Notes para Cisco IOS Release 12.2SX en Supervisor Engine 720, Supervisor Engine 32 y Supervisor Engine 2 para obtener más información.
Los switches Cisco Catalyst 6000/6500 pueden recargarse inesperadamente debido a una excepción inesperada.
01:22:25: %SNMP-3-AUTHFAIL: Authentication failure for SNMP req from host 10.1.2.2 01:23:25: %SNMP-3-AUTHFAIL: Authentication failure for SNMP req from host 10.1.2.2 01:23:40: ROMMON image upgrade in progress 01:23:40: Erasing flash Unexpected exception, CPU signal 5, PC = 0x402F3DC4
Mientras la actualización de ROMMon está en curso, si el sistema recibe una consulta SNMP, puede hacer que el switch se recargue.
Complete este procedimiento para evitar que el switch colapse cuando realice la actualización de ROMMon:
no snmp-server
redundancy force-switchover
Este mensaje aparece como puerto del resultado del comando show stacks (también parte del comando show tech-support). El mensaje completo es similar a este:
*************************************************** ******* Information of Last System Crash ********** *************************************************** Using bootflash:crashinfo. %Error opening bootflash:crashinfo (File not found) *************************************************** ****** Information of Last System Crash - SP ****** *************************************************** The last crashinfo failed to be written. Please verify the exception crashinfo configuration the filesytem devices, and the free space on the filesystem devices. Using crashinfo_FAILED. %Error opening crashinfo_FAILED (File not found)
Existen dos condiciones en las que se muestra un mensaje de este tipo:
La MSFC puede fallar con una excepción de error de bus, que podría ser causada por un problema de software o hardware. Estos mensajes de error podrían mostrar:
*** System received a Bus Error exception *** signal= 0xa, code= 0x10, context= 0x60ef02f0 PC = 0x601d22f8, Cause = 0x2420, Status Reg = 0x34008002
!--- Output is suppressed. System was restarted by bus error at PC 0x0, address 0x0 at 15:31:54 EST Wed Mar 29 2000 !--- Output is suppressed.
Si la dirección indicada es una dirección no válida fuera del intervalo de memoria, se trata de un error de software. Si la dirección se encuentra en el rango válido, la causa del problema es probablemente una falla de hardware de la memoria del procesador.
Para obtener más información sobre estos tipos de caídas de error de bus, refiérase a Resolución de Problemas por Desperfectos de Bus. Consulte Cisco bug ID CSCdx92013 (sólo clientes registrados) para obtener más información.
La MSFC no contiene protección de memoria ECC. Por lo tanto, la MSFC se bloquea al detectar un error de paridad. Estos son algunos de los errores que puede ver cuando esto ocurre:
*** System received a Cache Parity Exception *** signal= 0x14, code= 0xa405c428, context= 0x60dd1ee0 PC = 0x6025b2a8, Cause = 0x6420, Status Reg = 0x34008002
!--- Output is suppressed. System returned to ROM by processor memory parity error at PC 0x6020F4D0, address 0x0 at 18:18:31 UTC Wed Aug 22 2001 !--- Output is suppressed.
En el archivo crashinfo, grabado en la memoria flash de inicialización o en la consola, verá:
Error: primary data cache, fields: data, SysAD virtual addr 0x4B288202, physical addr(21:3) 0x288200, vAddr(14:12) 0x0000 virtual address corresponds to pcimem, cache word 0 Address: 0x4B288200 not in L1 Cache Address: 0x4B288202 Can not be loaded into L1 Cache
Si el error ocurre más de una vez, debe reemplazar la MSFC. Si el error ocurre sólo una vez, puede haber experimentado un único evento alterado. En este caso, monitoree la MSFC. Consulte Errores de paridad de la memoria del procesador (PMPE) para obtener más información sobre los errores de paridad.
La MSFC2 contiene protección de memoria ECC. Sin embargo, hay ubicaciones de memoria en las que se verifica la paridad pero los errores de un solo bit no se pueden corregir. Estos son algunos mensajes de error que puede ver en el archivo crashinfo que indican un error de paridad:
Si estos mensajes de error se registran sólo una vez, es posible que haya experimentado una única alteración del evento. Supervise el MSFC2. Si los errores ocurren con más frecuencia, reemplace la MSFC2. Consulte Errores de paridad de la memoria del procesador (PMPE) para obtener más información sobre los errores de paridad.
Si su MSFC2 falla y tiene un archivo crashinfo en su dispositivo bootflash, ejecute el comando more bootflash:crashinfo_filename. El comando muestra la información del archivo crashinfo. Si ve el mensaje MISTRAL-3-ERROR en la sección de registro inicial del registro crashinfo, consulte Desperfectos de MSFC2 con Mensajes de Error Mistral-3 en el Archivo Crashinfo para determinar si ha encontrado alguna de las razones comunes.
El comando show system sanity ejecuta un conjunto de verificaciones predeterminadas en la configuración con una posible combinación de ciertos estados del sistema para compilar una lista de condiciones de advertencia. Las comprobaciones están diseñadas para encontrar cualquier elemento que parezca fuera de lugar. Las comprobaciones están diseñadas para ayudarle a mantener la configuración y funcionalidad del sistema deseada y correcta. Este comando se soporta en CatOS versión 8.3x o posterior.
Refiérase a Verificación de Integridad para Problemas de Configuración y Estado del Sistema para conocer la lista de verificaciones realizadas y ver el ejemplo de salida del comando.
Consulte Recuperación del Catalyst 6500/6000 con Supervisor Engine I o II para recuperar Cisco Catalyst 6000/6500 con Supervisor Engine 1 o 2.
Consulte Recuperación del Catalyst 6500/6000 con Supervisor Engine 720 o Supervisor Engine 32 para recuperar Cisco Catalyst 6000/6500 con Supervisor Engine 720 o 32.
El archivo crashinfo es una colección de información útil relacionada con la falla actual almacenada en la memoria Flash o bootflash. Cuando un router tiene un desperfecto debido a una corrupción de datos o pilas, se necesita más información de recarga para depurar este tipo de desperfecto; no basta con la salida del comando normal show stacks.
El archivo crashinfo contiene esta información:
Refiérase a Recuperación de Información del Archivo Crashinfo para obtener más información y para el procedimiento para recuperar el archivo crashinfo.
Refiérase a Creación de Vaciados de Memoria para obtener más información y para el procedimiento para recopilar el vaciado de memoria del dispositivo.
Para los Cisco Catalyst 6000/6500 Switches que ejecutan Native IOS, refiérase a Mensajes de Error Comunes en los Catalyst 6500/6000 Series Switches que Ejecutan Cisco IOS Software. Si ve un mensaje de error que no está en uno de los mensajes de error comunes, consulte:
Para los Cisco Catalyst 6000/6500 Switches que ejecutan el sistema operativo híbrido, refiérase a Mensajes de Error Comunes de CatOS en Catalyst 6500/6000 Series Switches. Si ve un mensaje de error que no está en uno de los mensajes de error comunes, consulte Guía de Mensajes del Sistema de los Procedimientos de Mensajes y Recuperación - Catalyst 6500 Series, 8.4.
Utilice el Analizador Cisco CLI (sólo clientes registrados) para recibir un análisis de resolución de problemas instantáneo y un curso de acción para su router, switch o dispositivo PIX mediante el resultado del comando show recolectado.