Cisco 12000 Series fout-boom in Internet Router Parity

Downloadopties

PDF (338.9 KB)
Met Adobe Reader op diverse apparaten bekijken
ePub (131.0 KB)
Bekijken in diverse apps op iPhone, iPad, Android, Sony Reader of Windows Phone
Mobi (Kindle) (181.5 KB)
Op Kindle-apparaat of via Kindle-app op meerdere apparaten bekijken

Bijgewerkt:29 april 2008

Document-id:29320

Inclusief taalgebruik

De documentatie van dit product is waar mogelijk geschreven met inclusief taalgebruik. Inclusief taalgebruik wordt in deze documentatie gedefinieerd als taal die geen discriminatie op basis van leeftijd, handicap, gender, etniciteit, seksuele oriëntatie, sociaaleconomische status of combinaties hiervan weerspiegelt. In deze documentatie kunnen uitzonderingen voorkomen vanwege bewoordingen die in de gebruikersinterfaces van de productsoftware zijn gecodeerd, die op het taalgebruik in de RFP-documentatie zijn gebaseerd of die worden gebruikt in een product van een externe partij waarnaar wordt verwezen. Lees meer over hoe Cisco gebruikmaakt van inclusief taalgebruik.

Over deze vertaling

Cisco heeft dit document vertaald via een combinatie van machine- en menselijke technologie om onze gebruikers wereldwijd ondersteuningscontent te bieden in hun eigen taal. Houd er rekening mee dat zelfs de beste machinevertaling niet net zo nauwkeurig is als die van een professionele vertaler. Cisco Systems, Inc. is niet aansprakelijk voor de nauwkeurigheid van deze vertalingen en raadt aan altijd het oorspronkelijke Engelstalige document (link) te raadplegen.

Inhoud

Inleiding

Voordat u begint

Conventies

Voorwaarden

Gebruikte componenten

Overzicht

Fout bij analyse van Gigabit-routeprocessor (GRP)

Fout bij analyse van lijnkaartpariteit

Parity/ECC-fouten in Cisco 12000 Series Gigabit-routeprocessor

Single-Bit ErOUTES (SBE’s)

Multi-bit OUTMS (MBE’s)

Pariteitsfouten in processorgeheugen (PMPE)

%GRP-3-PARITYERR foutmelding

%PRP-3-SBE_DATA: Slechte gegevens [hex] [hex] ECC rec [hex] calc [hex]

Parity/ECC-fouten in Cisco 12000 Series lijnkaarten

SDRAM ECC-fouten

Cache Parity Exceptions

Engine 0-gebaseerde lijnkaartfoutmeldingen

Engine 1-gebaseerde lijnkaartfoutmeldingen

Engine 2-gebaseerde lijnkaartfoutmeldingen

Engine 3-gebaseerde lijnkaartfoutmeldingen

Engine 4/4+ gebaseerde lijnkaartfoutmeldingen

Engine 5/5+ gebaseerde lijnkaartfoutmeldingen

Engine 6-gebaseerde lijnkaartfoutmeldingen

SPA-foutmeldingen

Pariteitsfouten in Cisco 12000 Series switchingfabric-kaarten

Gerelateerde informatie

Inleiding

Dit document legt de stappen uit om problemen op te lossen en een mislukt onderdeel of onderdeel van de Cisco 12000 Series Internet Router te isoleren nadat u een verscheidenheid aan parity foutmeldingen hebt ontvangen.

N.B.: Dit document heeft geen betrekking op de oorzaak van pariteitsfouten. Als u geïnteresseerd bent in een beknoptere definitie van pariteitsfouten (ook bekend als Single Event Upsets - SEUs) en hun mogelijke oorzaak, raden we u aan de documenten te lezen die zijn gekoppeld aan Verhoogde netwerkbeschikbaarheid.

Voordat u begint

Conventies

Zie de Cisco Technical Tips Convention voor meer informatie over documentconventies.

Voorwaarden

Voordat u met dit document verder gaat, raden we u aan de volgende documenten te lezen:

Gebruikte componenten

De informatie in dit document is gebaseerd op de onderstaande software- en hardwareversies.

Cisco 12000 Series internet-router
Alle versies van Cisco IOS®-software

De informatie in dit document is gebaseerd op apparaten in een specifieke laboratoriumomgeving. Alle apparaten die in dit document worden beschreven, hadden een opgeschoonde (standaard)configuratie. Als u in een levend netwerk werkt, zorg er dan voor dat u de potentiële impact van om het even welke opdracht begrijpt alvorens het te gebruiken.

Overzicht

Het grootste deel van Cisco 12000 Series de routeprocessors van Internet en lijnkaarten omvatten de functionaliteit van de Correctie van de Foutencode (ECC). Er zijn echter reeds lijnkaarten op het gebied die niet over de ECC-capaciteit beschikken. ECC-functionaliteit omvat alleen het RAM of Synchronous Dynamic RAM (SDRAM) geheugen op de kaarten. De rest wordt niet beschermd door ECC.

Hier is een vergelijking van ECC-functionaliteit voor lijnkaarten die met Cisco 12000 worden gebruikt:

Alle Engine 2 en latere kaarten hebben ECC-functionaliteit.
Modus 1-kaarten zijn na de invoering van de FCS veranderd in ECC.
Modus 0-kaarten hebben geen ECC-functionaliteit.
Sommige kaarten kunnen worden aangepast aan soortgelijke producten die de ECC-functionaliteit integreren.

De onderstaande tabel geeft een overzicht van de producten met de ECC-functionaliteit:

Niet-ECC-producten	ECC-producten
GRP(=)	GRP-B(=)
GE-SX/LH-SC(=)	GE-GBIC-SC-B(=)
GE-GBIC-SC-A(=)	GE-GBIC-SC-B(=)
8FE-FX-SC(=)	8FE-FX-SC-B(=)
8FE-TX-RF45(=)	8FE-TX-RJ45-B(=)
6DS3-MKB(=)	6DS3-SEM-B(=)
12DS3-SBM(=)	12DS3-Small Business-B(=)
OC12/SRP-IR-SC(=)	OC12/SRP-IR-SC-B(=)
OC12/SRP-M-SC(=)	OC12/SRP-mm-SC-B(=)
OC12/SRP-LR-SC(=)	OC12/SRP-LR-SC-B(=)

Opmerking: -B en ECC zijn onafhankelijk. - B: het product is een tweede belangrijke ordelijke herziening van de raad van bestuur. In sommige gevallen was dit de herziening voor het ECC.

Cisco biedt een Technology Migration Plan (TMP) waarmee u een niet-ECC-board kunt upgraden naar een nieuwe ECC-board. Er zal een krediet worden verleend voor de aankoop van de nieuwe ECC-raad in ruil voor de niet-ECC-raad.

Fout bij analyse van Gigabit-routeprocessor (GRP)

In het onderstaande stroomschema helpt u bepalen welke component van Cisco 12000 Series Internet Router verantwoordelijk is voor ECC-foutmeldingen (parity/Error Code Correction) op Gigabit Route Processor (GRP).

Opmerking: Opnemen en opnemen van de logbestanden voor technische ondersteuning en console van de show en verzamelen van alle crashinformatie-bestanden tijdens parity/ECC-foutgebeurtenissen.

Fout bij analyse van lijnkaartpariteit

In het onderstaande stroomschema kunt u bepalen welke component van een Cisco 12000 Series Internet Router lijnkaart verantwoordelijk is voor ECC (parity/Error Code Correction)-foutmeldingen:

Opmerking: Als een lijnkaart een parity/ECC-fout heeft ervaren, verzamel dan zoveel mogelijk informatie (zie lijnkaartcrashes voor probleemoplossing op de Cisco 12000 Series internetrouter voor meer informatie).

Cisco 12000 Series Internet Router herstelt van pariteitsfouten in andere lijnkaartherinneringen (SDRAM en SRAM) zonder crashing.

Parity/ECC-fouten in Cisco 12000 Series Gigabit-routeprocessor

Gegevens met slechte pariteit kunnen door verscheidene van de parity-check apparaten voor om het even welke lees- of schrijfverrichting op de Cisco 12000 Series Internet Router worden gemeld.

GRP-B en PRP gebruiken Single Bit Error Correction en Multi-bit Error Detectie ECC aan gedeeld geheugen (SDRAM). Een enkele fout in SDRAM wordt automatisch gecorrigeerd en het systeem blijft normaal functioneren.

Single-Bit ErOUTES (SBE’s)

PRP en GRP-B hebben de verbeterde Dynamic RAM (DRAM) controller die ECC ondersteunt. Daarom kunnen ze single-bit fouten corrigeren en multi-bit fouten rapporteren. Correctie van een fout in een enkele bit ziet er zo uit:

%Tiger-3-SBE: Single bit error detected and corrected at <address>

SBE's worden gecorrigeerd door het Error Correction Circuit en hebben geen invloed op de functionaliteit van GRP-B of PRP. Er is geen actie vereist voor fouten met één bits, tenzij ze vaak gebeuren. In dat geval is het raadzaam de verwerker-board te vervangen.

Multi-bit OUTMS (MBE’s)

De detectie van een multi-bit fout wordt gerapporteerd door een bus-foutuitzondering of een CPU-cacheparity-foutuitzondering.

Pariteitsfouten in processorgeheugen (PMPE)

Er wordt een foutmelding "Processor Memory Parity" gerapporteerd indien de CPU een pariteitsfout detecteert bij de toegang tot het externe cache van de processor (L3 op de GRP) via de SysAD-bus of bij een van de interne opslaggeheugen van de CPU (L1 of L2). Tabel 1 geeft voorbeelden van de berichten die zouden worden afgedrukt voor elk type cacheparity error:

Tabel 1: Parkeerlocatie voor cache

Plaats van pariteitsfout	Fout
L1 Instructie-cache	Fout: Primair, instr cache, velden: gegevens
L1-gegevenscache	Fout: Primair, data cache, velden: gegevens
L2-injectieschakeling	Fout: SysAD, instr cache, velden: gegevens
L2-gegevenscache	Fout: SysAD, data cache, velden: gegevens
L3-informatiecache	Fout: SysAD, instr cache, velden: 1e woord
L3-gegevenscache	Fout: SysAD, data cache, velden: 1e woord

Voorbeeld:

De eerste regel van het foutbericht geeft de locatie van de pariteitsfout aan en kan een locatie zijn die in Tabel 1 is opgenomen. In dit voorbeeld is de locatie L3-obstructie-cache.

Error: SysAD, instr cache, fields: data, 1st dword
Physical addr(21:3) 0x000000,
virtual addr 0x6040BF60, vAddr(14:12) 0x3000
virtual address corresponds to main:text, cache word 0  
           Low Data     High Data  Par  Low Data     High Data  Par
L1 Data:   0:0xAE620068 0x8C830000 0x00 1:0x50400001 0xAC600004 0x01          
           2:0xAC800000 0x00000000 0x02 3:0x1600000B 0x00000000 0x01           
           Low Data     High Data  Par  Low Data     High Data  Par
DRAM Data: 0:0xAE620068 0x8C830000 0x00 1:0x50400001 0xAC600004 0x01           
           2:0xAC800000 0x00000000 0x02 3:0x1600000B 0x00000000 0x01

De output van de show versie zou hier gelijk aan moeten zijn:

...System was restarted by processor memory parity error at PC 0x602310D0, 
address 0x0 at 03:18:21 GMT Sun Oct 27 2002 ...

Vanuit de uitvoer van de show context kunt u zien dat het systeem opnieuw is opgestart door een Cache Parity Exception:

Router#show context slot 11
CRASH INFO: Slot 11, Index 1, Crash at 19:08:07 CST Thu Nov 14 2002

VERSION:
GS Software (GSR-P-M), Version 12.0(22)S1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1)
TAC Support: http://www.cisco.com/tac
Compiled Mon 16-Sep-02 17:36 by nmasa
Card Type: Route Processor, S/N

LC uptime was 0 minutes.
System exception: sig=20, code=0xE42F3E4B, context=0x52CF3D44
System restarted by a Cache Parity Exception
STACK TRACE:
-Traceback= 5020453C 500E5E24 5010E6DC 5015F89C 501E9F6C 501E9F58
...

Vervang de GRP of PRP na een tweede storing.

%GRP-3-PARITYERR foutmelding

Het volgende bericht kan in de console-uitvoer verschijnen:

SEC 7: %GRP-3-PARITYERR: Parity error detected in the fabric buffers. Data (8)

Dit bericht betekent dat een pariteitsfout is gedetecteerd door de hardware van de fabric-interface in het GRP. Het hex-nummer geeft aan dat de fout de vector onderbreekt. Dit geeft doorgaans een hardwareprobleem aan op de GRP die de fout rapporteert (in dit geval sleuf 7). Het foutieve GRP moet worden vervangen wanneer een soortgelijk probleem zich opnieuw voordoet.

%PRP-3-SBE_DATA: Slechte gegevens [hex] [hex] ECC rec [hex] calc [hex]

Deze foutmelding wordt weergegeven wanneer de router gegevens met een slechte pariteit ontvangt.

Gegevens met slechte pariteit worden door verscheidene van de parity-check apparaten voor om het even welke gelezen of schrijfverrichting gemeld die op de Cisco 12000 Series Internet Router wordt uitgevoerd.

PRP gebruikt Single Bit Error Correction en Multi-bit Error Detectie ECC om geheugen (SDRAM) te delen. Een enkele fout in SDRAM wordt automatisch gecorrigeerd en het systeem blijft normaal functioneren.

Enkele-bits fouten (SBE) worden gecorrigeerd door de foutcorrectie Circuit (ECC) en hebben geen invloed op de functionaliteit van PRP. Er is geen actie vereist voor fouten met één bits, tenzij ze vaak voorkomen.

Als de fout zich vaak voordoet, is het raadzaam de processorplaat te vervangen.

Parity/ECC-fouten in Cisco 12000 Series lijnkaarten

SDRAM ECC-fouten

SDRAM-fouten (ECC) met één bit-correctie

Een fout met één bits is één bit gegevens die onjuist zijn in een woord dat uit het geheugen wordt gelezen. Voor SBE's kan de fout worden gecorrigeerd zonder dat de werking wordt onderbroken.

Er worden single-bit fouten gedetecteerd en de gecorrigeerde gegevens worden gepresenteerd. Bijvoorbeeld, fouten met één bits worden als volgt gerapporteerd bij motor 4/4+:
```
SLOT 6:Jul 19 07:37:34: %TX192-3-SDRAM_SBE: Error=0x2 - DIMM1 Syndrome=0x7600 
Addr=0xBEA09 Data bit80-Traceback= 401C8C9C 401C9508 401CDE08 401CDE40 4007F674 
4009ED0C 4009ECF8
```
SBE's worden gecorrigeerd door het Error Correction Circuit en hebben geen invloed op de functionaliteit van de lijnkaart. Er is geen actie vereist voor fouten met één bits, tenzij ze frequent voorkomen. In dat geval is het raadzaam de lijnkaart te vervangen.
Cisco SDRAM-fouten met meerdere bits

Een multi-bit fout is wanneer meer dan een bit onjuist is in hetzelfde woord. Voor MBE's wordt de fout gedetecteerd en de lijnkaart crasht. Het optreden van SBE's en MBE's is zeer zeldzaam.

Hier is een voorbeeld van het bericht gedrukt aan de console in antwoord op een multi-bit ECC fout in SDRAM:
```
SLOT 5:Jul 25 16:58:51: %MCC192-3-SDRAM_SBE: Error=0x808 - DIMM0 
Syndrome=0x31000000 Addr=0x81034 Data bit120
-Traceback= 401C8C9C 401C9508 40450018 400BF7D4
SLOT 5:Jul 25 16:58:51: %MCC192-3-SDRAM_MBE: Error=0x808 - DIMM0 
Syndrome=0x18000000 Addr=0x80834
-Traceback= 401C8D88 401C9508 40450018 400BF7D4
```
MBE's kunnen niet worden aangepast door ECC en zorgen dat de lijnkaart instort. De lijnkaart wordt dan opnieuw geladen en door de routeprocessor in normale werking gebracht.

Velddiagnostiek kan worden gebruikt om het geheugen van de lijnkaart voor MBE's te controleren. MBE's worden gedetecteerd door velddiagnostiek als geheugenfouten. Hieronder zie je een voorbeeld van een toetsenbord met meerdere bits fouten in de TX SDRAM die de diagnostiek van een veld niet hebben gehaald:
```
FDIAG_STAT_IN_PROGRESS(5): test #12 TX SDRAM Marching Pattern
FD 5> RIM:
FD 5> TX Registers
FD 5> INT_CAUSE_REG = 0x00000680
FD 5> Unexpected L3FE Interrupt occured.
FD 5> ERROR: TX BMA Asic Interrupt Occured
FD 5> *** 0-INT: External Interrupt ***
FDIAG_STAT_DONE_FAIL(5) test_num 12, error_code 1
Field Diagnostic: ****TEST FAILURE**** slot 5: last test run 12,
TX SDRAM Marching Pattern, error 1
Field Diag eeprom values: run 5 fail mode 1 (TEST FAILURE) slot 5
last test failed was 12, error code 1
```
Als u een QOC48 of een OC192 lijnkaart hebt, raadpleeg dan deze melding in het veld: QOC48/OC192 SBE’s/MBE’s. Anders moet u de lijnkaart na een tweede fout vervangen.

Cache Parity Exceptions

Controleer de waarde van het veld sig= in het veld van de show contextsleuf [sleuf#]-uitvoer:

Router#show context slot 4
       CRASH INFO: Slot 4, Index 1, Crash at 04:28:56 EDT Tue Apr 20 1999
       
VERSION:
GS Software (GLC1-LC-M), Version 11.2(15)GS1a, EARLY DEPLOYMENT RELEASE
  SOFTWARE (fc1)
Compiled Mon 28-Dec-98 14:53 by tamb
Card Type: 1 Port Packet Over SONET OC-12c/STM-4c, S/N CAB020500AL
System exception: SIG=20, code=0xA414EF5A, 
context=0x40337424
System restarted by a Cache Parity Exception

Sommige kaarten gebaseerd op de motor 1-expediteur zijn gevoelig voor interne cacheproblemen wanneer ze werken bij zeer specifieke spanning- en temperatuuromstandigheden.

Cache Error Restore Feature (CERF) is een software optie in Engine1 lijnkaarten die cacheparity fouten detecteert en corrigeert door fouten te spoelen uit het externe CPU-cache en de cache-lijn uit DRAM te verfrissen. Deze functie biedt intelligentie in het CPU-cachebeheeralgoritme die de CPU in staat stelt te herstellen van een cachegeheugen-parity-fout, waardoor een crash van een lijnkaart wordt voorkomen zonder dat er sprake is van een prestatiecrisis.

Opmerking: CERF is standaard ingeschakeld. De activiteit van deze software Error Correction Code (ECC) kan worden gevolgd door de opdracht van de showcontroller cerf. Om deze functie uit te schakelen gebruikt u het servicecentrum van de configuratie zonder het wereldwijd. -servicecentrum.

Zie melding uit het veld: Cache Parity Error op GSR 1 GE Card voor extra informatie.

Om te bepalen op welke verzendmotor de lijnkaart is gebaseerd, zie Hoe kan ik bepalen welke motorkaart in de doos draait? vanuit Cisco 12000 Series internetrouter: Vaak gestelde vragen document.

Als de lijnkaart is gebaseerd op Engine 1, moet de tijdelijke oplossing worden gebruikt om de Cisco IOS-software te upgraden naar een release die de Cache Error Return-functie (CERF) bevat. Deze optie is eerst beschikbaar in Cisco IOS-softwarerelease 12.0(21)S3. Als de functie nog steeds wordt crashing door Cache Parity Exception, moet de lijnkaart worden vervangen.

Als de lijnkaart is gebaseerd op een ander type motor, zou u de lijnkaart moeten vervangen bij het tweede voorval van een vergelijkbaar ongeluk.

Engine 0-gebaseerde lijnkaartfoutmeldingen

U kunt het volgende bericht in de console-logt:

SLOT 2:Oct 23 17:07:45.531 EST: %LC-3-L3FEERRS: L3FE DRAM error 12 
address 41E9B9A0
SLOT 2:Oct 23 17:07:45.531 EST: %LC-3-L3FEERR: L3FE error: rxbma 0 addr 0 
txbma 0 addr 0 dram 12 addr 41E9B9A0 io 0 addr 0
SLOT 2:Oct 23 17:07:45.531 EST: %GSR-3-INTPROC: Process Traceback= 40080BAC
	-Traceback= 40357084 40495D30 40496EE0 400CCF98

Dit bericht meldt een fout in de schrijfpariteit van een CPU-DRAM. L3FE staat voor Layer 3 verzendmotor. De lijnkaart moet worden vervangen wanneer zich een soortgelijk probleem voordoet.

Engine 1-gebaseerde lijnkaartfoutmeldingen

Hier zijn een aantal foutmeldingen die u kunt tegenkomen:

In de logbestanden voor een Gigabit-lijnkaart met één poort:
```
SLOT 5: %LCGE-3-INTR: TX GigaTranslator external interface parity error
```
Voor nieuwere borden is één fixeermiddel geweest om de TX GigaTranslator ASIC te vervangen door een veldprogrammeerbare gate array (FPGA). Wanneer zich een soortgelijk probleem voordoet, moet het bestuur worden vervangen.
In de console-uitvoer:
```
SLOT 6: %LC-3-ECC: Salsa ECC: About to handle ECC single bit error,
ECC status = 2 DRAM error status = = 21
SLOT 6: %LC-3-L3FEERR: L3FE error: rxbma 0 addr 0 txbma 0 addr 0 dram 21 
addr 200020 io 0 addr 0
SLOT 6: %LC-3-ECC: Salsa ECC: Addresses: Salsa returned =429BFDE8 correcting 
on = 429BFDE8
SLOT 6: %MEM_ECC-3-SBE: Single bit error detected and corrected at 0x429BFDE8
SLOT 6: %MEM_ECC-3-SYNDROME_SBE: 8-bit Syndrome for the detected Single-bit error: 
0x8A
SLOT 4: %MEM_ECC-3-SBE_HARD: Single bit *hard* error detected at 0x6299FB60
SLOT 1:Jun 10 05:29:47.690 EDT: %LC-3-ECC: Salsa ECC:  About to handle ECC single bit error,ECC status = 0 DRAM error status =12
SLOT 6:Sep 26 15:18:01: %LC-3-SWECC: L2 event cleared: EPC = 0x40631CCC, CERR = 0xE40BB933, SysAD Addr = 1, total = 1
SLOT 0:Dec  7 13:48:11.480: %LC-3-SWECC_DATA: L2 event cleared: EPC = 0x400A8040, CERR = 0xA01DCE58, l1v = 0x41E3C20441E3C1C5, dv =0x41E3C1C441E3C204, SysAD Addr = 0, total = 1
```
Deze berichten kunnen in de volgende onderdelen worden gesplitst:
- %LC-3-ECC: Salsa ECC - Er is een fout in L3FE ASIC van de lijnkaart.
- %LC-3-L3FEERR - Er is een fout in L3FE ASIC reg van de lijnkaart. informatie.
- %MEM_ECC-3-SBE - Er is een enkele bit-correcteerbare fout gedetecteerd op een leesbaar formulier uit DRAM. De opdracht show memory ecc kan worden gebruikt om tot nu toe ingelogde fouten met één bits te dumpen. Dit is hetzelfde als de %MEM_ECC-3-SBE_LIMIT foutmelding.
- %MEM_ECC-3-SYNDROME_SBE - Het 8-bits syndroom voor gedetecteerde eenbits fouten. Deze waarde geeft niet de exacte posities van de bits ten onrechte aan, maar kan worden gebruikt om de posities ervan aan te passen. Dit is hetzelfde als de foutmelding %MEM_ECC-3-SYNDROME_SBE_LIMIT.
  
  De lijnkaart meldde een fout met één bits en corrigeerde deze automatisch. Er is geen actie van uw onderdeel vereist, tenzij dit vaak voorkomt. In dat geval is het raadzaam de lijnkaart te vervangen.
- %LC-3-SWECC_DATA - Geeft aan dat een cache-gebeurtenis is gecorrigeerd op LC in SLOT 0 door de Software Error Correction Code (SWECC).
Een ander bericht dat u zou kunnen tegenkomen is:
```
SLOT 4: %MEM_ECC-3-SBE_HARD: Single bit *hard* error detected at 
0x6299FB60 
```
Dit bericht betekent dat er een oncorrigeerbare fout [harde fout] is gedetecteerd in een CPU-systeem die door de DRAM wordt gelezen. De opdracht Show memory ecc dumpt de single-bit fouten die tot nu toe zijn geregistreerd en geeft aan welke harde error address locaties zijn gedetecteerd.

Controleer het systeem met de opdracht Show memory ecc en vervang de DRAM als deze fouten te veel voorkomen hebben.

Engine 2-gebaseerde lijnkaartfoutmeldingen

U kunt de volgende fout in de console-uitvoer zien:

SLOT 6: %LC-6-PSAECC: An TLU SDRAM ECC correctable error occurred 
address 19C49FD
SLOT 2:035610: Feb 26 13:09:13.628 UTC: %LC-6-PSAECC: An PLU SDRAM ECC correctable error occurred address 1956059

Dit betekent dat het Packet Switching ASIC (PSA) ECC-beschermde SDRAM een corrigeerbare one-bit fout heeft geïdentificeerd. U hoeft geen actie uit te voeren, tenzij deze berichten regelmatig voorkomen. In dat geval is het raadzaam de lijnkaart te vervangen.

Engine 3-gebaseerde lijnkaartfoutmeldingen

U kunt deze fouten in de console-uitvoer zien:

SLOT 6:00:03:53: %PM622-3-SAR_SRAM_PARITY_ERR: (6/0): Parity error in Reassembly SAR SRAM address: 80000000.Resetting the port
SLOT 3:00:00:53: %PM622-3- SAR_MULTIBIT_ECC_ERR: (3/0): Multi-bit ECC Uncorrectable error in SAR SDRAM address: 80000000. Resseting the port.
SLOT 4:00:00:53: %PM622-3 SAR_SINGLE_BIT_ECC_ERR: (3/0): ECC corrected an error in SAR SDRAM address: 800000.
SLOT 0:Jun 25 20:45:53 KST: %EE48-6-ALPHAECC: RX ALPHA: An PLU SDRAM ECC correctable error occured address 1000C254
SLOT 0:Jun 25 20:45:53 KST: %EE48-6-ALPHAECC2: RX ALPHA: An PLU SDRAM ECC multibit error occured at address 1000E254
SLOT 5:Nov 17 09:46:30.171: %EE48-6-ALPHA_PARITY: TX ALPHA: Transient SRAM64 parity corrected error 3E Data  0 100000 Parity bits  0
SLOT 10:Feb 21 16:55:36: %EE48-3-ALPHA_SRAM64_ERR: TX ALPHA: ALPHA_PST_RANGE_ERR error 11003F Data  0 0 Parity bits  0
SLOT 4:Jan 15 06:30:00.942 UTC: %EE48-2-GULF_TX_SRAM_ERROR: ASIC GULF: TX SRAM uncorrectable error detected. Details=0x0000
SLOT 0:Mar 16 19:50:22.464 cst: %EE48-4-QM_ZBT_PARITY: ToFab Address 0xB95E Data 0x1
SLOT 5:May 17 06:17:35.507: %EE48-4-QM_NON_ZBT_PARITY: ToFab Error 0x10000028
SLOT 5:May 17 06:17:53.883: %EE48-4-QM_ZBT_PARITY_TRANSIENT: FrFab Address 0x0 Data 0x7E
SLOT 5:May 17 06:17:53.883: %EE48-4- GULF_RX_TB_PARITY_ERROR: ASIC GULF: RX telecom bus parity error on port 0
SLOT 1:Dec 13 00:27:42: %EE48-3-SRAM_PARITY: SRAM parity: Unable to find shadow 281B9EB4
SLOT 0:Aug  4 08:55:37: %EE48-3-QM_PARITY: FrFab Address 0x1859E Data 0x10
SLOT 0:Aug  4 08:55:37: %EE48-3-QM_ERROR: FrFab error register 0x80000.

Engine 4/4+ gebaseerde lijnkaartfoutmeldingen

U kunt de volgende berichten op Engine 4/4+ lijnkaarten tegenkomen:

SLOT 4: %RX192-3-HINTR: status = 0x4000000, mask = 0x3FFFFFFF - 
Parity error on rx_pbc_mem.
-Traceback= 401C37C0 403D8814 400BE1EC
SLOT 4: %LC-3-ERR_INTR: Error interrupt occurred
-Traceback= 400CE028 400C8DF0 40010A24

SLOT 3: %RX192-3-HINTR: status = 0x4000000, mask = 0x3FFFFFFF - 
Parity error on rx_pbc_mem.
-Traceback= 406012E0 406972A0 400C555C
%FIB-3-FIBDISABLE: Fatal error, slot 3: IPC failure

SLOT 13:Dec  5 07:30:15.272 cst: %HERA-6-PAM_ACL_SBE: PKT CNT MEM Syndrome=0x8 Addr=0x523C
SLOT 2:00:03:41: %MCC192-6-RED_PARAM1_SBE: Parameter 1 - Single Bit Error detected and corrected 
Syndrome = 0x7, Address = 0x43, samebit No, diffbit No
SLOT 2:00:03:41: %MCC192-6-RED_PARAM2_SBE: Parameter 1 - Single Bit Error detected and corrected
Syndrome = 0x7, Address = 0x43, samebit No, diffbit No
SLOT 5:Apr 26 11:56:08.160: %MCC192-3-SDRAM_MBE: Error=0x200 - DIMM1 Syndrome=0x3000 Addr=0x811C3
SLOT 10:Mar  6 05:05:26.965: %RX192-3-ADJ_MEM_MBE: phy addr 0x7905E648, offset 0xBCC9, old ecc 0x0, new ecc 0x0, bit -1, value 0x0 - MBE on Adjacency Memory..
SLOT 13:Dec  5 07:30:15.272 cst: %HERA-6-PAM_ACL_MBE: PKT CNT MEM Syndrome=0x8 Addr=0x523C
SLOT 2:00:03:41: %MCC192-6-RED_PARAM1_MBE: Parameter 1 - Single Bit Error detected and corrected
Syndrome = 0x7, Address = 0x43, samebit No, diffbit No
SLOT 2:00:03:41: %MCC192-3-RED: Error=0x80000 - RED PARAM 1 ECC SBE Error.
-Traceback= 405AF5E0 405B1CEC 406DFF7C 406E057C 400FC7E
SLOT 2:00:03:41: %MCC192-6-RED_PARAM2_MBE: Parameter 1 - Single Bit Error detected and corrected
Syndrome = 0x7, Address = 0x43, samebit No, diffbit No
Sep  8 14:32:09 jst: %MEM_ECC-3-SYNDROME_SBE_LIMIT: 
8-bit Syndrome for the detected Single-bit error: 0xD5

De symptomen voor deze kwestie zijn onder meer:

Cisco Express Doorsturen op deze lijnkaart wordt uitgeschakeld
De bijbehorende poorten blijven omhoog/omhoog
De lijnkaart kan automatisch worden opnieuw ingesteld

Als de lijnkaart niet opnieuw wordt ingesteld, moet de werkronden de opdracht microcode opnieuw laden <sleuf> uitvoeren:

Dit bericht geeft niet altijd een hardwareprobleem aan met de RX192-module. Sommige IOS-softwarefuncties van Cisco kunnen deze foutmelding als bijwerking produceren. Als dit bericht maar één keer verschijnt, houdt u het bord in de gaten. Het apparaat wordt opnieuw ingesteld. Als het probleem zich blijft voordoen, wordt de kaart automatisch opnieuw ingesteld. Neem contact op met uw Cisco Technical Support vertegenwoordiger voor ondersteuning als dit bericht blijft bestaan.

De SBE gebeurtenissen kunnen op E4/E4+ worden gecontroleerd met de opdracht van de showcontrollers mcc192 ecc:

LC-Slot4#show controllers mcc192 ecc 
MCC192 SDRAM ECC Counters
        SBE = 0x0,              MBE = 0x0
TX192 SDRAM ECC Counters
        SBE = 0x0,              MBE = 0x0

Dit rapporteert over zowel RX- als TX-geheugen.

Engine 5/5+ gebaseerde lijnkaartfoutmeldingen

U kunt deze fouten in de console-uitvoer zien:

SLOT 1:Jun 26 20:45:53 KST: %EE192-6-WAHOOECC: RX WAHOO: An PLU SDRAM ECC correctable error occured address 20000254
SLOT 9:Sep 2 21:27:49.680 GMT+8: %MCC192-3-PKTMEM_SBE: Single bit error detected and corrected
SLOT 14:Jul 18 07:19:24.637:  RX_XBMA: 1-bit CPUIM_ECCERR1 error 0x2
SLOT 15:Jan  4 16:53:16.591:  TX_XBMA: (1) QSRAM qinfo SBE detected. info: 0x82605455
SLOT 12:Dec 12 22:34:15: %EE192-4-BM_ERRSSS: FrFab BM BADDR ECC ERR info single bit error(s) corrected, error 8250F63E count:  2
SLOT 1:Nov 22 13:40:02 JST: %EE192-3-QM_ERROR: RX_XBMA OQLLM error error register 0x1
-Traceback= 40AE71AC 406078C4 405F5EC0
SLOT 7:001113: Oct 24 10:50:28.520 BST: %EE192-3-WAHOOERRS: RX WAHOO: WAHOO_CSRAM_CNTRL_INT PIPE0 error 8
SLOT 6:Oct  4 16:48:00.487: %EE192-3-WAHOOERRSSS: RX WAHOO: WAHOO_FFCRAM_CNTRL_INT PIPE0 error 4  addr 3FBFAB8  agent 94
SLOT 7:001114: Oct 24 10:50:28.520 BST: %EE192-3-WAHOOERRSSSS: RX WAHOO: WAHOO_PPC_INT PIPE1 error pl_ctl 4000226 pl_aa_avl F9F7B pl_aa_end 7FF9 pl_aa_fatal 4800000
SLOT 6:Oct  4 16:48:00.487: %EE192-3-WAHOOERRS: RX WAHOO WAHOO_NFC_SRAM_MULTI_ECC_ERR multi-bit CSSRAM error 
SLOT 6:Oct  4 16:48:00.487: %EE192-3-WAHOOERRS: WAHOO_CTCAM_CNTRL_INT multi-bit CSRAM error
SLOT 6:Oct  4 16:48:00.487: %EE192-3-WAHOOERRS: WAHOO_FFCRAM_CNTRL_INT MBE
SLOT 6:Oct  4 16:48:00.487: %EE192-3-WAHOOERRS: FSRAM not OK WAHOO_FSRAM_CNTRL_INT ECC_1_BIT_EE | ECC_UNCORR_EE
SLOT 6:Oct  4 16:48:00.487: %EE192-3-WAHOOERRS: WAHOO_CTCAM_CNTRL_INT multi-bit CSRAM error
SLOT 1:00:01:14: WEEKLY_THROTTLE_SOCKEYE_SBE: SOCKEYE SBE: addr: 0xC2A007C0, synd: 0xC4
SLOT 1:00:01:14: WEEKLY_THROTTLE_CBSRAM_SBE_TX+i: CBSRAM SBE TX: 1-bit CBSRAM error.
SLOT 1:00:01:14: WEEKLY_THROTTLE_CBSRAM_SBE_RX+i: CBSRAM SBE RX: 1-bit CBSRAM error.
SLOT 1:00:01:14: WEEKLY_THROTTLE_CSSRAM_SBE_TX+i: CSSRAM SBE TX: 1-bit CSSRAM error.
SLOT 1:00:01:14: WEEKLY_THROTTLE_CSSRAM_SBE_RX+i: CSSRAM SBE RX: 1-bit CSSRAM error.
SLOT 1:00:01:14: WEEKLY_THROTTLE_CSRAM_SBE_TX+i: CSRAM SBE TX: 1-bit CSRAM error.
SLOT 1:00:01:14: WEEKLY_THROTTLE_CSRAM_SBE_RX+i: CSRAM SBE RX: 1-bit CSRAM error.
SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FW_TCAM_PRTY_TX+throttle_i: TX FTCAM PRTY error, status = 0x2
SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FW_TCAM_PRTY_RX+throttle_i: RX FTCAM PRTY error, status = 0x2
SLOT 1:00:01:14: WEEKLY_THROTTLE_W_CL_TCAM_PRTY_TX+throttle_i: TX CLTCAM PRTY error, status = 0x2
SLOT 1:00:01:14: WEEKLY_THROTTLE_W_CL_TCAM_PRTY_RX+throttle_i: RX CLTCAM PRTY error, status = 0x2
SLOT 1:00:01:14: WEEKLY_THROTTLE_W_NF_TCAM_PRTY_TX+throttle_i: TX NFTCAM PRTY error, status = 0x2
SLOT 1:00:01:14: WEEKLY_THROTTLE_W_NF_TCAM_PRTY_RX+throttle_i: RX NFTCAM PRTY error, status = 0x2
SLOT 1:00:01:14: WEEKLY_THROTTLE_W_TCAM_PRTY_VMR: TCAM PRTY VMR error, status = 0x2
SLOT 1:00:01:14: WEEKLY_THROTTLE_W_TCAM_PRTY_NO-VMR: TCAM PRTY NO-VMR error, status = 0x3
SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FCRAM_SBE_TX: FCRAM SBE TX error, status = 0x2
SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FCRAM_SBE_RX: FCRAM SBE TX error, status = 0x3
SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FCRAM_PER_CHIP_SBE_TX: FCRAM CHIP SBE error, status = 0x2
SLOT 1:00:01:14: WEEKLY_THROTTLE_W_ FCRAM_PER_CHIP_SBE_RX: FCRAM CHIP SBE error, status = 0x3
SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FSRAM_SBE_TX: FSRAM SBE TX error, status = 0x2
SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FSRAM_SBE_RX: FSRAM SBE RX error, status = 0x3
SLOT 1:00:01:14: WEEKLY_THROTTLE_W_ FSRAM_MBE_TX: FSRAM MBE RX error, status = 0x2
SLOT 1:00:01:14: WEEKLY_THROTTLE_W_ FSRAM_MBE_RX: FSRAM MBE RX error, status = 0x3
SLOT 1:00:01:14: WEEKLY_THROTTLE_BM_ISERR_TX: ISERR TX error, status = 0x2
SLOT 1:00:01:14: WEEKLY_THROTTLE_BM_ISERR_RX: ISERR RX error, status = 0x3
SLOT 1:00:01:14: WEEKLY_THROTTLE_BM_FCRAM_SBE_TX: FCRAM SBE TX error, status = 0x2
SLOT 1:00:01:14: WEEKLY_THROTTLE_BM_FCRAM_SBE_RX: FCRAM SBE RX error, status = 0x3
SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_QSRAM_LINK_SBE_TX: QSRAM LINK SBE TX error, status = 0x2
SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_QSRAM_LINK_SBE_RX: QSRAM LINK SBE RX error, status = 0x3
SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_QSRAM_QEINFO_SBE_TX: QSRAM queue info sbe tx error, status = 0x2
SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_QSRAM_QEINFO_SBE_TX: QSRAM queue info sbe rx error, status = 0x3
SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_QSRAM_BADDR_SBE_TX: qsram bad addr sbe tx error, status = 0x2
SLOT 1:00:01:14: WEEKLY_THROTTLE_ QM_QSRAM_BADDR_SBE_RX: qsram bad addr sbe rx error, status = 0x3
SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_OQLLM_SBE_TX: oqllm sbe tx error, status = 0x2
SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_OQLLM_SBE_RX: oqllm sbe rx error status = 0x3

Engine 6-gebaseerde lijnkaartfoutmeldingen

U kunt deze fouten in de console-uitvoer zien:

SLOT 0:Jan 14 08:53:44.581 GMT: %FIA-3-RAMECCERR: To Fabric ECC error was detected Single Bit Error RAM2 status = 0x8000  
Syndrome = 0x0 addr = 0x0
SLOT 6:Apr 29 09:36:12: %E6LC-4-ECC_THRESHOLD: HERMES VID SBE exceeded threshold, possible memory failure
SLOT 4:*Mar 13 23:38:19.295: %E6_RX192-3-MTRIE_SBE: Head1 Syndrome=0x94 Addr=0xFFF2B 
-Traceback= 40544830 40546A90 40688C94 400EDC18
SLOT 7:*Mar 4 1234:19.295: %E6_RX192-3-ADJ_SBE: Syndrome=0x59 Addr=0xFFF2B
-Traceback= 40000830 40036A90 40555D44 400ddd23
SLOT 14:Dec  9 20:02:29: %E6_RX192-6-PBC_SBE: Single bit error detected and corrected RLDRAM 
Syndrome=0x61 Addr=0xF855
Dec  9 20:02:33: %GRP-4-RSTSLOT: Resetting the card in the slot: 14,Event: linecard error report
SLOT 4:06:21:43: %E6_RX192-3-ACL_SBE: ACTION MEM Syndrome=0x7 Addr=0x0
-Traceback= 40549740 4054A7E0 4068D814 400EE018
SLOT 6:Mar 28 03:30:19: %RX192-3-HINTR: status = 0x1000000000000, mask = 0x7FFFFF0FA320F - L3X SBE error.
-Traceback= 405816DC 406A1010 406A1650 400F70E8
SLOT 6:Mar 28 03:30:19: %E6_RX192-6-VID_SBE: Single bit error detected and corrected VID memory Syndrome=0x19 Addr=0xE51B
SLOT 6:Nov 27 23:32:36: %HERA-3-PKTMEM_SBE: Single bit error detected and corrected Error=0x80 – 
Syndrome=0x5100000000000000 Addr=0x894620 Data bit116
SLOT 7:Oct 2 23:32:36: %HERA-6- MCD_SBE: Single bit error detected and corrected Error=0x50 – 
Syndrome=0x3100000000000000 Addr=0x331110 Data bit216
SLOT 1:Jun 22 03:32:36: %HERA-6- MRW_SBE: Single bit error detected and corrected Error=0x50 – 
Syndrome=0x3100000000000000 Addr=0x331110 Data bit216
SLOT 12:May 24 03:03:36: %HERA-6- UPF_SBE: Single bit error detected and corrected Error=0x60 – 
Syndrome=0x4100000000000000 Addr=0x451140 Data bit216
SLOT 13:Dec  5 07:30:15.272 cst: %HERA-6-PAM_ACL_SBE: PKT CNT MEM Syndrome=0x8 Addr=0x523C
SLOT 9:May  5 18:52:14: %HERA-6-QM_FBF_SBE: Free Block FIFO - Single Bit Error detected and corrected 
Syndrom = 0x10, Addr = 0x778, samebit Yes, diffbit No
SLOT 9:May  5 18:52:14: %HERA-3-QM: Error=0x40 - FBF RAM ECC SBE.
-Traceback= 405AD4CC 405AF5D0 405F2E80 406DCDB8 406DD434 400FC500
SLOT 3:Aug 16 00:45:14: %MCC192-6-RED_AQD_SBE: Average Queue Depth - Single Bit Error detected and corrected 
Syndrome = 0x7, Address = 0x89, samebit No, diffbit No
SLOT 2:Jan 23 06:29:56 KST: %MCC192-6-RED_STAT_SBE: Statistics - Single Bit Error detected and corrected 
Syndrome = 0x38, Address = 0xFF, samebit No, diffbit No
SLOT 4:*Mar 13 23:38:19.295: %E6_RX192-3-MTRIE_MBE: Single bit error detected and corrected Head1 
Syndrome=0x94 Addr=0xFFF2B
SLOT 7:*Mar 4 1234:19.295: %E6_RX192-3-ADJ_MBE: Syndrome=0x59 Addr=0xFFF2B
-Traceback= 40000830 40036A90 40555D44 400ddd23
00:00:18: %E6_RX192-3-PBC_MBE: ADJ OBANK LO Syndrome=0xE5 Addr=0x142
-Traceback= 405BF8B0 405C0F08 406E8D78 406E93B8 400FCCE0
SLOT 6:Mar 28 03:30:19: %E6_RX192-6-VID_MBE: Single bit error detected and corrected VID memory Syndrome=0x19 Addr=0xE51B
SLOT 0:Apr 18 06:44:53.751 GMT: %HERA-3-PKTMEM_MBE: Error=0x1010 - Syndrome=0x9900000000
SLOT 7:Oct 2 23:32:36: %HERA-6- MCD_MBE: Single bit error detected and corrected Error=0x50 – 
Syndrome=0x3100000000000000 Addr=0x331110 Data bit216
SLOT 1:Jun 22 03:32:36: %HERA-6- MRW_MBE: Single bit error detected and corrected Error=0x50 - Syndrome=0x3100000000000000 Addr=0x331110 Data bit216
SLOT 13:Dec  5 07:30:15.272 cst: %HERA-6-PAM_ACL_MBE: PKT CNT MEM Syndrome=0x8 Addr=0x523C
SLOT 9:May  5 18:52:14: %HERA-6-QM_FBF_MBE: Free Block FIFO - Single Bit Error detected and corrected 
Syndrome = 0x10, Addr = 0x778, samebit Yes, diffbit No
SLOT 3:Aug 16 00:45:14: %MCC192-6-RED_AQD_MBE: Average Queue Depth - Single Bit Error detected and corrected 
Syndrome = 0x7, Address = 0x89, samebit No, diffbit No
SLOT 2:Jan 23 06:29:56 KST: %MCC192-6-RED_STAT_MBE: Statistics - Single Bit Error detected and corrected 
Syndrome = 0x38, Address = 0xFF, samebit No, diffbit No

SPA-foutmeldingen

U kunt deze fouten in de console-uitvoer zien:

SLOT 7:Jan 4 02:04:00.487: %SPA_CHOC_DSX-3-UNCOR_PARITY_ERR:  SPA4/0: CHOC SPA parity error(s) encountered
SLOT 7:Jan 4 02:04:00.487: %MCT1E1-3-UNCOR_PARITY_ERR:  SPA5/0: T1E1 SPA parity error(s) encountered
SLOT 3: 00:33:48: %MCT1E1-3-UNCOR_MEM_ERR: SPA3/0: 1 uncorrectable HDLC SRAM memory error(s) encountered.
SLOT 1:Oct  3 14:42:45.727: %SPA_PLIM-4-SBE_ECC: SPA-4XT3/E3[1/2] reports 2 SBE occurrence at 1 addresses
SLOT 1: Jul 22 05:26:29.613 UTC: %SPA_DATABUS-3-SPI4_SINGLE_DIP4_PARITY: SIP Sbslt 0 Ingress Sink - A single DIP4 parity error has occurred on the data bus.
SLOT 4: Dec  2 22:44:05: %SPA_DATABUS-3-SPI4_SINGLE_DIP2_PARITY: SIP Sbslt 0 Egress Source - A single DIP 2 parity error on the FIFO status bus has occurred.
SLOT 1:Oct  3 14:42:45.727: %SPA_PLIM-4-SBE_OVERFLOW: SPA-4XT3/E3[1/2] reports SBE table (2 elements) overflows
SLOT 1:Oct  3 14:42:45.727: % SPA_PLUGIN-3-SPI4_SETCB: SPA-4XT3/E3[1/2] : IPC SPI4 set callback failed(status 2).

Pariteitsfouten in Cisco 12000 Series switchingfabric-kaarten

Alle parity foutmeldingen met betrekking tot switching fabric-kaarten worden in detail behandeld in Hardware Problemen opsporen en verhelpen voor Cisco 12000 Series Internet Router. Deze berichten bevatten (niet-limitatieve lijst):

%FABRIC-3-PARITYERR: To Fabric parity error was detected. Grant parity error 
Data = 0x2.

SLOT 1:%FABRIC-3-PARITYERR: To Fabric parity error was detected. 

Grant parity error Data = 0x1