Dieses Dokument enthält Informationen zur Fehlerbehebung bei Abstürzen bei Cisco® Aggregation Services Routern der Serie ASR 1000.
Es gibt keine spezifischen Anforderungen für dieses Dokument.
Die Informationen in diesem Dokument basierend auf folgenden Software- und Hardware-Versionen:
Alle Cisco Aggregation Services Router der Serie ASR 1000, einschließlich der Router 1002, 1004 und 1006.
Alle Cisco IOS XE Software-Versionen, die Cisco Aggregation Services Router der Serie ASR 1000 unterstützen.
Die Informationen in diesem Dokument beziehen sich auf Geräte in einer speziell eingerichteten Testumgebung. Alle Geräte, die in diesem Dokument benutzt wurden, begannen mit einer gelöschten (Nichterfüllungs) Konfiguration. Wenn Ihr Netz Live ist, überprüfen Sie, ob Sie die mögliche Auswirkung jedes möglichen Befehls verstehen.
Weitere Informationen zu Dokumentkonventionen finden Sie unter Cisco Technical Tips Conventions (Technische Tipps von Cisco zu Konventionen).
Die Cisco Aggregation Services Router der Serie ASR 1000 stellen die Cisco IOS XE Software als ihre Softwarearchitektur vor. Die auf der Cisco IOS Software basierende Cisco IOS XE Software ist ein modulares Betriebssystem, das auf einem Linux-Kernel auf einem Route Processor (RP), Embedded Services Processor (ESP) oder SPA Interface Processor (SIP) basiert. Der IOS-Daemon (IOSD) und andere IOS XE-Prozesse werden auf dem Linux-Kernel ausgeführt. Daher sind in Tabelle 1 auf den Aggregation Services Routern der Cisco Serie ASR 1000 verschiedene Abstürze aufgeführt.
Tabelle 1: Arten von Abstürzen
Arten von Abstürzen | Modul | Beschreibung |
---|---|---|
IOSD-Absturz | RP | Die Cisco IOS Software wird als IOSD auf einem Linux-Kernel auf RP ausgeführt. |
SPA-Treiberabsturz | SIP | Begrenzte Cisco IOS Software steuert SPA auf SIP. |
Absturz des Cisco IOS XE-Prozesses | RP ESP SIP | Mehrere Cisco IOS XE-Prozesse werden auf einem Linux-Kernel ausgeführt. Beispielsweise werden der Chassis-Manager, der Forwarding Manager, der Schnittstellenmanager usw. auf RP ausgeführt. |
Cisco Quantum Flow Processor (QFP) Microcode Crash | ESP | Der Mikrocode wird auf QFP ausgeführt. QFP ist ein ASICs für die Paketweiterleitung auf ESP. |
Linux-Kernel-Absturz | RP ESP SIP | Linux-Kernel wird auf RP, ESP und SIP ausgeführt. |
Wenn ein unerwartetes Neuladen von Modul auftritt, müssen Sie sicherstellen, dass die Konsolenausgabe, das Crashinfo-Dateiverzeichnis und das Core Dump-Dateiverzeichnis für die Fehlerbehebung verfügbar sind. Um die Ursache zu ermitteln, müssen zunächst möglichst viele Informationen über das Problem erfasst werden. Diese Informationen sind erforderlich, um die Ursache des Problems zu bestimmen:
Konsolenprotokolle - Weitere Informationen finden Sie unter Anwenden der richtigen Terminal-Emulatoreinstellungen für Konsolenverbindungen.
Syslog-Informationen: Wenn Sie den Router so eingerichtet haben, dass er Protokolle an einen Syslog-Server sendet, können Sie Informationen über den Vorfall abrufen. Weitere Informationen finden Sie unter Konfigurieren von Cisco Geräten für Syslog.
show platform - Der Befehl show platform zeigt den Status von RPs, ESPs, SPAs und Netzteilen an.
show tech-support - Der Befehl show tech-support ist eine Zusammenstellung von vielen verschiedenen Befehlen, die show version und show running-config enthalten. Wenn bei einem Router Probleme auftreten, bittet der Techniker des Cisco Technical Assistance Center (TAC) normalerweise um diese Informationen, um das Hardwareproblem zu beheben. Sie müssen den show tech-support erfassen, bevor Sie ein Neuladen oder Ein-/Ausschalten durchführen, da diese Aktionen einen Verlust von Informationen über das Problem verursachen können.
Hinweis: Der Befehl show tech-support enthält nicht die Befehle show platform oder show logging.
Boot Sequence Information (Informationen zur Startsequenz): Die vollständige Startsequenz, wenn der Router Bootfehler aufweist.
Crashinfo-Datei (falls verfügbar) — Siehe Crashinfo-Datei Abschnitt.
Core Dump-Datei (falls verfügbar) - Siehe Abschnitt Core Dump File.
Tracelog-Datei (falls verfügbar) - Auf den Aggregation Services Routern der Cisco Serie ASR 1000 werden die Ablaufverfolgungsprotokolle der Cisco IOS XE-Prozesse unter Festplatte generiert:tracelogs (ASR 1006 oder ASR 1004) oder bootflash:tracelogs (ASR 100 2) auf dem aktiven RP. Wenn das Cisco IOS XE abstürzt, bittet der Cisco TAC-Techniker in der Regel, diese Informationen zu sammeln, um das Problem zu beheben.
Wenn der IOSD- oder SPA-Treiber abstürzt, wird unter dem in Tabelle 2 angegebenen Speicherort eine Crashinfo-Datei generiert.
Tabelle 2: Speicherort der Crashinfo-Datei
Modelle | Arten von Abstürzen | Crashinfo-Dateispeicherort |
---|---|---|
ASR 1002 | IOSD Crash SPA-Treiber-Crash | Bootflash: zum RP |
ASR 1004 ASR 1006 | IOSD-Absturz | Bootflash: zum RP |
SPA-Treiberabsturz | Festplatte: zum RP |
In Tabelle 3 werden die Dateinamen Crashinfo angezeigt.
Tabelle 3: Dateiname von Crashinfo
Arten von Abstürzen | Crashinfo-Dateiname | Beispiel |
---|---|---|
IOSD-Absturz | crashinfo_RP_SlotNumber_00_Date-Time-Zone | crashinfo_RP_00_00_20080807-063430-UTC |
SPA-Treiberabsturz | crashinfo_SIP_SlotNumber_00_Date-Time-Zone | crashinfo_SIP_00_00_20080828-084907-UTC |
Wenn ein Prozess abstürzt, finden Sie unter dem in Tabelle 4 angegebenen Speicherort eine Core-Dump-Datei. Ein Core Dump ist eine vollständige Kopie des Speicherabbilds des Prozesses. Es wird empfohlen, die Core Dump-Dateien zu speichern, bis die Fehlerbehebung abgeschlossen ist. Dies liegt daran, dass ein Core-Dump viel mehr Informationen über ein Crash-Problem enthält als eine Crashinfo-Datei und für eine gründliche Untersuchung erforderlich ist. Im Fall des Cisco ASR 1002 Routers, da er keine Festplatte hat: Gerät, wird eine Core Dump-Datei unter bootflash:core/ generiert.
Tabelle 4 - Speicherort der Core Dump-Datei
Modelle | Speicherort der Core-Dump-Datei |
---|---|
ASR 1002 | Bootflash:Core/auf dem RP |
ASR 1004 ASR 1006 | Festplatte:Core/auf dem RP |
Nicht nur das Core Dump des RP, sondern auch das Core Dump der ESP- oder SIP-Prozesse werden unter demselben Standort generiert. Im Fall des Cisco ASR 1006-Routers müssen Sie denselben Standort des Standby-RP überprüfen, da es sich bei dem Problem um den aktiven RP handelte.
Tabelle 5: Core Dump-Dateiname
Arten von Abstürzen | Core Dump-Dateiname | Beispiel |
---|---|---|
IOSD-Absturz | hostname_RP_SlotNumber_ppc_linux_iosd-_ProcessID.core.gz | Router_RP_0_ppc_linux_iosd-_17407.core.gz |
SPA-Treiberabsturz | hostname_SIP_SlotNumber_mcpcc-lc-ms_ProcessID.core.gz | Router_SIP_1_mcpcc-lc-ms_6098.core.gz |
Absturz des IOS XE-Prozesses | hostname_FRU_SlotNumber_ProcessName_ProcessID.core.gz | Router_RP_0_fman_rp_28778.core.gz Router_ESP_1_cpp_cp_svr_4497.core.gz |
Cisco QFP-Absturz | hostname_ESP_SlotNumber_cpp-mcplo-ucode_ID.core.gz | Router_ESP_0_cpp-mcplo-ucode_042308082102.core.gz |
Linux-Kernel-Absturz | hostname_FRU_SlotNumber_kernel.core | Router_ESP_0_kernel.core |
Der IOS-Daemon (IOSD) wird als eigener Linux-Prozess (ppc_linux_iosd-) auf dem RP ausgeführt. Im dualen IOS-Modus (nur Cisco ASR 1002 Router und Cisco ASR 1004 Router) werden auf dem RP zwei IOSDs ausgeführt.
Um einen IOSD-Absturz zu identifizieren, suchen Sie die unten dargestellte Ausgabe der Ausnahme auf der Konsole. Bei einem Absturz eines Cisco ASR 1002-Routers oder Cisco ASR 1004-Routers ohne dualen IOS-Modus wird das Gerät neu geladen. Bei einem Absturz eines Cisco ASR 1002-Routers oder Cisco ASR 1004-Routers im dualen IOS-Modus wird das IOSD auf den RP umgeschaltet. Bei einem Absturz des Cisco ASR 1006-Routers wird der RP umgeschaltet und ein neuer Standby-RP neu geladen.
Exception to IOS Thread: Frame pointer 2C111978, PC = 1029ED60 ASR1000-EXT-SIGNAL: U_SIGSEGV(11), Process = Exec -Traceback= 1#106b90f504fce8544ce4979667ec2d5d :10000000+29ED60 :10000000+29ECB4 :10000000+2A1A9C :10000000+2A1DAC :10000000+492438 :10000000+1C22DC0 :10000000+4BBBE0 Fastpath Thread backtrace: -Traceback= 1#106b90f504fce8544ce4979667ec2d5d c:BC16000+C2AF0 c:BC16000+C2AD0 iosd_unix:BD73000+111DC pthread:BA1B000+5DA0 Auxiliary Thread backtrace: -Traceback= 1#106b90f504fce8544ce4979667ec2d5d pthread:BA1B000+95E4 pthread:BA1B000+95C8 c:BC16000+D7294 iosd_unix:BD73000+1A83C pthread:BA1B000+5DA0 PC = 0x1029ED60 LR = 0x1029ECB4 MSR = 0x0002D000 CTR = 0x0BD83C2C XER = 0x20000000 R0 = 0x00000000 R1 = 0x2C111978 R2 = 0x2C057890 R3 = 0x00000034 R4 = 0x000000B4 R5 = 0x0000003C R6 = 0x2C111700 R7 = 0x00000000 R8 = 0x12B04780 R9 = 0x00000000 R10 = 0x2C05048C R11 = 0x00000050 R12 = 0x22442082 R13 = 0x13B189AC R14 = 0x00000000 R15 = 0x00000000 R16 = 0x00000000 R17 = 0x00000001 R18 = 0x00000000 R19 = 0x00000000 R20 = 0x00000000 R21 = 0x00000000 R22 = 0x00000000 R23 = 0x00000001 R24 = 0x00000001 R25 = 0x34409AD4 R26 = 0x00000000 R27 = 0x2CE88448 R28 = 0x00000001 R29 = 0x00000000 R30 = 0x3467A0FC R31 = 0x2C1119B8 Writing crashinfo to bootflash:crashinfo_RP_00_00_20080904-092940-UTC Buffered messages: (last 4096 bytes only) ...
Wenn das IOSD abstürzt, werden die Crashinfo-Datei und die Core-Dump-Datei auf dem RP generiert.
Router#dir bootflash: Directory of bootflash: bootflash:crashinfo_RP_00_00_20080904-092940-UTC Router#dir harddisk:core Directory of harddisk:core/ 3620877 -rw- 10632280 Sep 4 2008 09:31:00 +00:00 Router_RP_0_ppc_linux_iosd-_17407.core.gz
Die SPA-Treiber verfügen über begrenzte IOS-Funktionen für die SPA-Steuerung und werden auf SIP ausgeführt, da der mcc-lc-ms-Prozess und einer der Cisco IOS XE-Prozesse ausgeführt werden. Sie können den Absturz des SPA-Treibers identifizieren, wenn Sie feststellen, dass der Prozess mcpc-lc-ms heruntergehalten wird. Nachdem der SPA-Treiber abstürzt, wird der SPA neu geladen.
Aug 28 08:52:12.418: %PMAN-3-PROCHOLDDOWN: SIP0: pman.sh: The process mcpcc-lc-ms has been helddown (rc 142) Aug 28 08:52:12.425: %ASR1000_OIR-6-REMSPA: SPA removed from subslot 0/0, interfaces disabled Aug 28 08:52:12.427: %SPA_OIR-6-OFFLINECARD: SPA (SPA-1X10GE-L-V2) offline in subslot 0/0 Aug 28 08:52:13.131: %ASR1000_OIR-6-INSSPA: SPA inserted in subslot 0/0 Aug 28 08:52:19.060: %LINK-3-UPDOWN: SIP0/0: Interface EOBC0/1, changed state to up Aug 28 08:52:20.064: %SPA_OIR-6-ONLINECARD: SPA (SPA-1X10GE-L-V2) online in subslot 0/0
Wenn der SPA-Treiber abstürzt, werden die Crashinfo-Datei und die Core-Dump-Datei auf dem RP generiert.
Router#dir harddisk: Directory of harddisk:/ 14 -rw- 224579 Aug 28 2008 08:52:06 +00:00 crashinfo_SIP_00_00_20080828-085206-UTC Router#dir harddisk:core Directory of harddisk:/core/ 4653060 -rw- 1389762 Aug 28 2008 08:52:12 +00:00 Router_SIP_0_mcpcc-lc-ms_6985.core.gz
Die Cisco IOS XE-Prozesse werden auf einem Linux-Kernel auf RP, ESP und SIP ausgeführt. In Tabelle 6 sind die wichtigsten Prozesse aufgeführt. Wenn ein Absturz auftritt, wird das Modul neu geladen.
Tabelle 6: Wichtigste Cisco IOS XE-Prozesse
Titel | Prozessname | Modul |
---|---|---|
Chassis-Manager | auffordern | RP |
cman_fp | ESP | |
CMC | SIP | |
Umgebungsüberwachung | emd | RP, ESP, SIP |
Weiterleitungsmanager | fman_rp | RP |
fman_fp_image | ESP | |
Host-Manager | hman | RP, ESP, SIP |
Schnittstellenmanager | imitieren | RP |
IMCD | SIP | |
Protokollierungsmanager | Plogd | RP, ESP, SIP |
Pluggable-Service | PSD | RP |
QFP-Client-Kontrollprozess | cpp_cr_svr | ESP |
QFP-Treiberprozess | cpp_driver | ESP |
QFP HA-Server | cpp_ha_top_level_server | ESP |
QFP-Client-Serviceprozess | cpp_sp_server | ESP |
Shell-Manager | klug | RP |
Falls der cpp_cp_svr-Prozess auf einem ESP des Cisco ASR 1006-Routers abstürzt, kann diese Meldung in der Konsole angezeigt werden.
Jan 24 23:37:06.644 JST: %PMAN-3-PROCHOLDDOWN: F0: pman.sh: The process cpp_cp_svr has been helddown (rc 134) Jan 24 23:37:06.727 JST: %PMAN-0-PROCFAILCRIT: F0: pvp.sh: A critical processcpp_cp_svr has failed (rc 134) Jan 24 23:37:11.539 JST: %ASR1000_OIR-6-OFFLINECARD: Card (fp) offline in slot F0
Sie finden die Core Dump Datei auf der Festplatte:core/.
Router#dir harddisk:core Directory of harddisk:/core/ 1032194 -rw- 38255956 Jan 24 2009 23:37:06 +09:00 Router_ESP_0_cpp_cp_svr_4714.core.gz
Die Ablaufverfolgung des Prozesses kann nützliche Ausgaben enthalten.
Router#dir harddisk:tracelogs/cpp_cp* Directory of harddisk:tracelogs/ 4456753 -rwx 24868 Jan 24 2009 23:37:15 +09:00 cpp_cp_F0-0.log.4714.20090124233714
Cisco hat den Cisco Quantum Flow Processor sowohl als Hardware- als auch als Softwarearchitektur entwickelt. Die erste Generation besteht aus zwei Teilen Silicium; Bei späteren Generationen kann es sich um Einchip-Lösungen handeln, die der hier beschriebenen Softwarearchitektur entsprechen. Allein der Begriff "Cisco QuantumFlow-Prozessor" bezieht sich auf die gesamte Hardware- und Softwarearchitektur des Netzwerkprozessors.
Wenn der QFP-Code abstürzt, wird ESP neu geladen. Um den Absturz des QFP-Codes zu identifizieren, suchen Sie diese Ausgabe in der Konsole oder der Core-Dump-Datei von cpp-mcplo-ucode:
Dec 17 05:50:26.417 JST: %IOSXE-3-PLATFORM: F0: cpp_cdm: CPP crashed, core file /tmp/corelink/ Router_ESP_0_cpp-mcplo-ucode_121708055026.core.gz Dec 17 05:50:28.206 JST: %ASR1000_OIR-6-OFFLINECARD: Card (fp) offline in slot F0
Sie finden die Core Dump-Datei.
Router#dir harddisk:core Directory of harddisk:core/ 3719171 -rw- 1572864 Dec 17 2008 05:50:31 +09:00 Router_ESP_0_cpp-mcplo-ucode_121708055026.core.gz
Auf der Cisco Serie ASR 1000 wird ein Linux-Kernel auf RP, ESP und SIP ausgeführt. Wenn ein Linux-Kernel abstürzt, wird das Modul ohne die Crash-Ausgabe neu geladen. Nachdem es wieder hochgefahren ist, können Sie den Linux-Kernel-Absturz identifizieren, wenn Sie die Core-Dump-Datei des Linux-Kernels finden. Die Größe der Kerneldatei kann mehr als 100MByte betragen.
Router#dir harddisk:core Directory of harddisk:/core/ 393230 ---- 137389415 Dec 19 2008 01:19:40 +09:00 Router_RP_0_kernel_20081218161940.core
Wenn Sie nach den oben beschriebenen Schritten weiterhin Hilfe benötigen und eine Serviceanfrage beim Cisco TAC erstellen möchten, fügen Sie diese Informationen zur Fehlerbehebung bei einem Router-Ausfall ein: |
---|
Hinweis: Laden Sie den Router vor dem Erfassen dieser Informationen nicht manuell neu, oder schalten Sie ihn ein, es sei denn, Sie müssen einen Router-Ausfall beheben, da dies zum Verlust wichtiger Informationen führen kann, die zur Bestimmung der Ursache des Problems erforderlich sind. |
Überarbeitung | Veröffentlichungsdatum | Kommentare |
---|---|---|
1.0 |
17-Mar-2009 |
Erstveröffentlichung |