Dit document legt de stappen uit om problemen op te lossen en een mislukt onderdeel of onderdeel van de Cisco 12000 Series Internet Router te isoleren nadat u een verscheidenheid aan parity foutmeldingen hebt ontvangen.
N.B.: Dit document heeft geen betrekking op de oorzaak van pariteitsfouten. Als u geïnteresseerd bent in een beknoptere definitie van pariteitsfouten (ook bekend als Single Event Upsets - SEUs) en hun mogelijke oorzaak, raden we u aan de documenten te lezen die zijn gekoppeld aan Verhoogde netwerkbeschikbaarheid.
Zie de Cisco Technical Tips Convention voor meer informatie over documentconventies.
Voordat u met dit document verder gaat, raden we u aan de volgende documenten te lezen:
De informatie in dit document is gebaseerd op de onderstaande software- en hardwareversies.
Cisco 12000 Series internet-router
Alle versies van Cisco IOS®-software
De informatie in dit document is gebaseerd op apparaten in een specifieke laboratoriumomgeving. Alle apparaten die in dit document worden beschreven, hadden een opgeschoonde (standaard)configuratie. Als u in een levend netwerk werkt, zorg er dan voor dat u de potentiële impact van om het even welke opdracht begrijpt alvorens het te gebruiken.
Het grootste deel van Cisco 12000 Series de routeprocessors van Internet en lijnkaarten omvatten de functionaliteit van de Correctie van de Foutencode (ECC). Er zijn echter reeds lijnkaarten op het gebied die niet over de ECC-capaciteit beschikken. ECC-functionaliteit omvat alleen het RAM of Synchronous Dynamic RAM (SDRAM) geheugen op de kaarten. De rest wordt niet beschermd door ECC.
Hier is een vergelijking van ECC-functionaliteit voor lijnkaarten die met Cisco 12000 worden gebruikt:
Alle Engine 2 en latere kaarten hebben ECC-functionaliteit.
Modus 1-kaarten zijn na de invoering van de FCS veranderd in ECC.
Modus 0-kaarten hebben geen ECC-functionaliteit.
Sommige kaarten kunnen worden aangepast aan soortgelijke producten die de ECC-functionaliteit integreren.
De onderstaande tabel geeft een overzicht van de producten met de ECC-functionaliteit:
Niet-ECC-producten | ECC-producten |
---|---|
GRP(=) | GRP-B(=) |
GE-SX/LH-SC(=) | GE-GBIC-SC-B(=) |
GE-GBIC-SC-A(=) | GE-GBIC-SC-B(=) |
8FE-FX-SC(=) | 8FE-FX-SC-B(=) |
8FE-TX-RF45(=) | 8FE-TX-RJ45-B(=) |
6DS3-MKB(=) | 6DS3-SEM-B(=) |
12DS3-SBM(=) | 12DS3-Small Business-B(=) |
OC12/SRP-IR-SC(=) | OC12/SRP-IR-SC-B(=) |
OC12/SRP-M-SC(=) | OC12/SRP-mm-SC-B(=) |
OC12/SRP-LR-SC(=) | OC12/SRP-LR-SC-B(=) |
Opmerking: -B en ECC zijn onafhankelijk. - B: het product is een tweede belangrijke ordelijke herziening van de raad van bestuur. In sommige gevallen was dit de herziening voor het ECC.
Cisco biedt een Technology Migration Plan (TMP) waarmee u een niet-ECC-board kunt upgraden naar een nieuwe ECC-board. Er zal een krediet worden verleend voor de aankoop van de nieuwe ECC-raad in ruil voor de niet-ECC-raad.
In het onderstaande stroomschema helpt u bepalen welke component van Cisco 12000 Series Internet Router verantwoordelijk is voor ECC-foutmeldingen (parity/Error Code Correction) op Gigabit Route Processor (GRP).
Opmerking: Opnemen en opnemen van de logbestanden voor technische ondersteuning en console van de show en verzamelen van alle crashinformatie-bestanden tijdens parity/ECC-foutgebeurtenissen.
In het onderstaande stroomschema kunt u bepalen welke component van een Cisco 12000 Series Internet Router lijnkaart verantwoordelijk is voor ECC (parity/Error Code Correction)-foutmeldingen:
Opmerking: Als een lijnkaart een parity/ECC-fout heeft ervaren, verzamel dan zoveel mogelijk informatie (zie lijnkaartcrashes voor probleemoplossing op de Cisco 12000 Series internetrouter voor meer informatie).
Cisco 12000 Series Internet Router herstelt van pariteitsfouten in andere lijnkaartherinneringen (SDRAM en SRAM) zonder crashing.
Gegevens met slechte pariteit kunnen door verscheidene van de parity-check apparaten voor om het even welke lees- of schrijfverrichting op de Cisco 12000 Series Internet Router worden gemeld.
GRP-B en PRP gebruiken Single Bit Error Correction en Multi-bit Error Detectie ECC aan gedeeld geheugen (SDRAM). Een enkele fout in SDRAM wordt automatisch gecorrigeerd en het systeem blijft normaal functioneren.
PRP en GRP-B hebben de verbeterde Dynamic RAM (DRAM) controller die ECC ondersteunt. Daarom kunnen ze single-bit fouten corrigeren en multi-bit fouten rapporteren. Correctie van een fout in een enkele bit ziet er zo uit:
%Tiger-3-SBE: Single bit error detected and corrected at <address>
SBE's worden gecorrigeerd door het Error Correction Circuit en hebben geen invloed op de functionaliteit van GRP-B of PRP. Er is geen actie vereist voor fouten met één bits, tenzij ze vaak gebeuren. In dat geval is het raadzaam de verwerker-board te vervangen.
De detectie van een multi-bit fout wordt gerapporteerd door een bus-foutuitzondering of een CPU-cacheparity-foutuitzondering.
Er wordt een foutmelding "Processor Memory Parity" gerapporteerd indien de CPU een pariteitsfout detecteert bij de toegang tot het externe cache van de processor (L3 op de GRP) via de SysAD-bus of bij een van de interne opslaggeheugen van de CPU (L1 of L2). Tabel 1 geeft voorbeelden van de berichten die zouden worden afgedrukt voor elk type cacheparity error:
Tabel 1: Parkeerlocatie voor cache
Plaats van pariteitsfout | Fout |
---|---|
L1 Instructie-cache | Fout: Primair, instr cache, velden: gegevens |
L1-gegevenscache | Fout: Primair, data cache, velden: gegevens |
L2-injectieschakeling | Fout: SysAD, instr cache, velden: gegevens |
L2-gegevenscache | Fout: SysAD, data cache, velden: gegevens |
L3-informatiecache | Fout: SysAD, instr cache, velden: 1e woord |
L3-gegevenscache | Fout: SysAD, data cache, velden: 1e woord |
Voorbeeld:
De eerste regel van het foutbericht geeft de locatie van de pariteitsfout aan en kan een locatie zijn die in Tabel 1 is opgenomen. In dit voorbeeld is de locatie L3-obstructie-cache.
Error: SysAD, instr cache, fields: data, 1st dword Physical addr(21:3) 0x000000, virtual addr 0x6040BF60, vAddr(14:12) 0x3000 virtual address corresponds to main:text, cache word 0 Low Data High Data Par Low Data High Data Par L1 Data: 0:0xAE620068 0x8C830000 0x00 1:0x50400001 0xAC600004 0x01 2:0xAC800000 0x00000000 0x02 3:0x1600000B 0x00000000 0x01 Low Data High Data Par Low Data High Data Par DRAM Data: 0:0xAE620068 0x8C830000 0x00 1:0x50400001 0xAC600004 0x01 2:0xAC800000 0x00000000 0x02 3:0x1600000B 0x00000000 0x01
De output van de show versie zou hier gelijk aan moeten zijn:
...System was restarted by processor memory parity error at PC 0x602310D0, address 0x0 at 03:18:21 GMT Sun Oct 27 2002 ...
Vanuit de uitvoer van de show context kunt u zien dat het systeem opnieuw is opgestart door een Cache Parity Exception:
Router#show context slot 11 CRASH INFO: Slot 11, Index 1, Crash at 19:08:07 CST Thu Nov 14 2002 VERSION: GS Software (GSR-P-M), Version 12.0(22)S1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) TAC Support: http://www.cisco.com/tac Compiled Mon 16-Sep-02 17:36 by nmasa Card Type: Route Processor, S/N LC uptime was 0 minutes. System exception: sig=20, code=0xE42F3E4B, context=0x52CF3D44 System restarted by a Cache Parity Exception STACK TRACE: -Traceback= 5020453C 500E5E24 5010E6DC 5015F89C 501E9F6C 501E9F58 ...
Vervang de GRP of PRP na een tweede storing.
Het volgende bericht kan in de console-uitvoer verschijnen:
SEC 7: %GRP-3-PARITYERR: Parity error detected in the fabric buffers. Data (8)
Dit bericht betekent dat een pariteitsfout is gedetecteerd door de hardware van de fabric-interface in het GRP. Het hex-nummer geeft aan dat de fout de vector onderbreekt. Dit geeft doorgaans een hardwareprobleem aan op de GRP die de fout rapporteert (in dit geval sleuf 7). Het foutieve GRP moet worden vervangen wanneer een soortgelijk probleem zich opnieuw voordoet.
Deze foutmelding wordt weergegeven wanneer de router gegevens met een slechte pariteit ontvangt.
Gegevens met slechte pariteit worden door verscheidene van de parity-check apparaten voor om het even welke gelezen of schrijfverrichting gemeld die op de Cisco 12000 Series Internet Router wordt uitgevoerd.
PRP gebruikt Single Bit Error Correction en Multi-bit Error Detectie ECC om geheugen (SDRAM) te delen. Een enkele fout in SDRAM wordt automatisch gecorrigeerd en het systeem blijft normaal functioneren.
Enkele-bits fouten (SBE) worden gecorrigeerd door de foutcorrectie Circuit (ECC) en hebben geen invloed op de functionaliteit van PRP. Er is geen actie vereist voor fouten met één bits, tenzij ze vaak voorkomen.
Als de fout zich vaak voordoet, is het raadzaam de processorplaat te vervangen.
SDRAM-fouten (ECC) met één bit-correctie
Een fout met één bits is één bit gegevens die onjuist zijn in een woord dat uit het geheugen wordt gelezen. Voor SBE's kan de fout worden gecorrigeerd zonder dat de werking wordt onderbroken.
Er worden single-bit fouten gedetecteerd en de gecorrigeerde gegevens worden gepresenteerd. Bijvoorbeeld, fouten met één bits worden als volgt gerapporteerd bij motor 4/4+:
SLOT 6:Jul 19 07:37:34: %TX192-3-SDRAM_SBE: Error=0x2 - DIMM1 Syndrome=0x7600 Addr=0xBEA09 Data bit80-Traceback= 401C8C9C 401C9508 401CDE08 401CDE40 4007F674 4009ED0C 4009ECF8
SBE's worden gecorrigeerd door het Error Correction Circuit en hebben geen invloed op de functionaliteit van de lijnkaart. Er is geen actie vereist voor fouten met één bits, tenzij ze frequent voorkomen. In dat geval is het raadzaam de lijnkaart te vervangen.
Cisco SDRAM-fouten met meerdere bits
Een multi-bit fout is wanneer meer dan een bit onjuist is in hetzelfde woord. Voor MBE's wordt de fout gedetecteerd en de lijnkaart crasht. Het optreden van SBE's en MBE's is zeer zeldzaam.
Hier is een voorbeeld van het bericht gedrukt aan de console in antwoord op een multi-bit ECC fout in SDRAM:
SLOT 5:Jul 25 16:58:51: %MCC192-3-SDRAM_SBE: Error=0x808 - DIMM0 Syndrome=0x31000000 Addr=0x81034 Data bit120 -Traceback= 401C8C9C 401C9508 40450018 400BF7D4 SLOT 5:Jul 25 16:58:51: %MCC192-3-SDRAM_MBE: Error=0x808 - DIMM0 Syndrome=0x18000000 Addr=0x80834 -Traceback= 401C8D88 401C9508 40450018 400BF7D4
MBE's kunnen niet worden aangepast door ECC en zorgen dat de lijnkaart instort. De lijnkaart wordt dan opnieuw geladen en door de routeprocessor in normale werking gebracht.
Velddiagnostiek kan worden gebruikt om het geheugen van de lijnkaart voor MBE's te controleren. MBE's worden gedetecteerd door velddiagnostiek als geheugenfouten. Hieronder zie je een voorbeeld van een toetsenbord met meerdere bits fouten in de TX SDRAM die de diagnostiek van een veld niet hebben gehaald:
FDIAG_STAT_IN_PROGRESS(5): test #12 TX SDRAM Marching Pattern FD 5> RIM: FD 5> TX Registers FD 5> INT_CAUSE_REG = 0x00000680 FD 5> Unexpected L3FE Interrupt occured. FD 5> ERROR: TX BMA Asic Interrupt Occured FD 5> *** 0-INT: External Interrupt *** FDIAG_STAT_DONE_FAIL(5) test_num 12, error_code 1 Field Diagnostic: ****TEST FAILURE**** slot 5: last test run 12, TX SDRAM Marching Pattern, error 1 Field Diag eeprom values: run 5 fail mode 1 (TEST FAILURE) slot 5 last test failed was 12, error code 1
Als u een QOC48 of een OC192 lijnkaart hebt, raadpleeg dan deze melding in het veld: QOC48/OC192 SBE’s/MBE’s. Anders moet u de lijnkaart na een tweede fout vervangen.
Controleer de waarde van het veld sig= in het veld van de show contextsleuf [sleuf#]-uitvoer:
Router#show context slot 4 CRASH INFO: Slot 4, Index 1, Crash at 04:28:56 EDT Tue Apr 20 1999 VERSION: GS Software (GLC1-LC-M), Version 11.2(15)GS1a, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) Compiled Mon 28-Dec-98 14:53 by tamb Card Type: 1 Port Packet Over SONET OC-12c/STM-4c, S/N CAB020500AL System exception: SIG=20, code=0xA414EF5A, context=0x40337424 System restarted by a Cache Parity Exception
Sommige kaarten gebaseerd op de motor 1-expediteur zijn gevoelig voor interne cacheproblemen wanneer ze werken bij zeer specifieke spanning- en temperatuuromstandigheden.
Cache Error Restore Feature (CERF) is een software optie in Engine1 lijnkaarten die cacheparity fouten detecteert en corrigeert door fouten te spoelen uit het externe CPU-cache en de cache-lijn uit DRAM te verfrissen. Deze functie biedt intelligentie in het CPU-cachebeheeralgoritme die de CPU in staat stelt te herstellen van een cachegeheugen-parity-fout, waardoor een crash van een lijnkaart wordt voorkomen zonder dat er sprake is van een prestatiecrisis.
Opmerking: CERF is standaard ingeschakeld. De activiteit van deze software Error Correction Code (ECC) kan worden gevolgd door de opdracht van de showcontroller cerf. Om deze functie uit te schakelen gebruikt u het servicecentrum van de configuratie zonder het wereldwijd. -servicecentrum.
Zie melding uit het veld: Cache Parity Error op GSR 1 GE Card voor extra informatie.
Om te bepalen op welke verzendmotor de lijnkaart is gebaseerd, zie Hoe kan ik bepalen welke motorkaart in de doos draait? vanuit Cisco 12000 Series internetrouter: Vaak gestelde vragen document.
Als de lijnkaart is gebaseerd op Engine 1, moet de tijdelijke oplossing worden gebruikt om de Cisco IOS-software te upgraden naar een release die de Cache Error Return-functie (CERF) bevat. Deze optie is eerst beschikbaar in Cisco IOS-softwarerelease 12.0(21)S3. Als de functie nog steeds wordt crashing door Cache Parity Exception, moet de lijnkaart worden vervangen.
Als de lijnkaart is gebaseerd op een ander type motor, zou u de lijnkaart moeten vervangen bij het tweede voorval van een vergelijkbaar ongeluk.
U kunt het volgende bericht in de console-logt:
SLOT 2:Oct 23 17:07:45.531 EST: %LC-3-L3FEERRS: L3FE DRAM error 12 address 41E9B9A0 SLOT 2:Oct 23 17:07:45.531 EST: %LC-3-L3FEERR: L3FE error: rxbma 0 addr 0 txbma 0 addr 0 dram 12 addr 41E9B9A0 io 0 addr 0 SLOT 2:Oct 23 17:07:45.531 EST: %GSR-3-INTPROC: Process Traceback= 40080BAC -Traceback= 40357084 40495D30 40496EE0 400CCF98
Dit bericht meldt een fout in de schrijfpariteit van een CPU-DRAM. L3FE staat voor Layer 3 verzendmotor. De lijnkaart moet worden vervangen wanneer zich een soortgelijk probleem voordoet.
Hier zijn een aantal foutmeldingen die u kunt tegenkomen:
In de logbestanden voor een Gigabit-lijnkaart met één poort:
SLOT 5: %LCGE-3-INTR: TX GigaTranslator external interface parity error
Voor nieuwere borden is één fixeermiddel geweest om de TX GigaTranslator ASIC te vervangen door een veldprogrammeerbare gate array (FPGA). Wanneer zich een soortgelijk probleem voordoet, moet het bestuur worden vervangen.
In de console-uitvoer:
SLOT 6: %LC-3-ECC: Salsa ECC: About to handle ECC single bit error, ECC status = 2 DRAM error status = = 21 SLOT 6: %LC-3-L3FEERR: L3FE error: rxbma 0 addr 0 txbma 0 addr 0 dram 21 addr 200020 io 0 addr 0 SLOT 6: %LC-3-ECC: Salsa ECC: Addresses: Salsa returned =429BFDE8 correcting on = 429BFDE8 SLOT 6: %MEM_ECC-3-SBE: Single bit error detected and corrected at 0x429BFDE8 SLOT 6: %MEM_ECC-3-SYNDROME_SBE: 8-bit Syndrome for the detected Single-bit error: 0x8A SLOT 4: %MEM_ECC-3-SBE_HARD: Single bit *hard* error detected at 0x6299FB60 SLOT 1:Jun 10 05:29:47.690 EDT: %LC-3-ECC: Salsa ECC: About to handle ECC single bit error,ECC status = 0 DRAM error status =12 SLOT 6:Sep 26 15:18:01: %LC-3-SWECC: L2 event cleared: EPC = 0x40631CCC, CERR = 0xE40BB933, SysAD Addr = 1, total = 1 SLOT 0:Dec 7 13:48:11.480: %LC-3-SWECC_DATA: L2 event cleared: EPC = 0x400A8040, CERR = 0xA01DCE58, l1v = 0x41E3C20441E3C1C5, dv =0x41E3C1C441E3C204, SysAD Addr = 0, total = 1
Deze berichten kunnen in de volgende onderdelen worden gesplitst:
%LC-3-ECC: Salsa ECC - Er is een fout in L3FE ASIC van de lijnkaart.
%LC-3-L3FEERR - Er is een fout in L3FE ASIC reg van de lijnkaart. informatie.
%MEM_ECC-3-SBE - Er is een enkele bit-correcteerbare fout gedetecteerd op een leesbaar formulier uit DRAM. De opdracht show memory ecc kan worden gebruikt om tot nu toe ingelogde fouten met één bits te dumpen. Dit is hetzelfde als de %MEM_ECC-3-SBE_LIMIT foutmelding.
%MEM_ECC-3-SYNDROME_SBE - Het 8-bits syndroom voor gedetecteerde eenbits fouten. Deze waarde geeft niet de exacte posities van de bits ten onrechte aan, maar kan worden gebruikt om de posities ervan aan te passen. Dit is hetzelfde als de foutmelding %MEM_ECC-3-SYNDROME_SBE_LIMIT.
De lijnkaart meldde een fout met één bits en corrigeerde deze automatisch. Er is geen actie van uw onderdeel vereist, tenzij dit vaak voorkomt. In dat geval is het raadzaam de lijnkaart te vervangen.
%LC-3-SWECC_DATA - Geeft aan dat een cache-gebeurtenis is gecorrigeerd op LC in SLOT 0 door de Software Error Correction Code (SWECC).
Een ander bericht dat u zou kunnen tegenkomen is:
SLOT 4: %MEM_ECC-3-SBE_HARD: Single bit *hard* error detected at 0x6299FB60
Dit bericht betekent dat er een oncorrigeerbare fout [harde fout] is gedetecteerd in een CPU-systeem die door de DRAM wordt gelezen. De opdracht Show memory ecc dumpt de single-bit fouten die tot nu toe zijn geregistreerd en geeft aan welke harde error address locaties zijn gedetecteerd.
Controleer het systeem met de opdracht Show memory ecc en vervang de DRAM als deze fouten te veel voorkomen hebben.
U kunt de volgende fout in de console-uitvoer zien:
SLOT 6: %LC-6-PSAECC: An TLU SDRAM ECC correctable error occurred address 19C49FD SLOT 2:035610: Feb 26 13:09:13.628 UTC: %LC-6-PSAECC: An PLU SDRAM ECC correctable error occurred address 1956059
Dit betekent dat het Packet Switching ASIC (PSA) ECC-beschermde SDRAM een corrigeerbare one-bit fout heeft geïdentificeerd. U hoeft geen actie uit te voeren, tenzij deze berichten regelmatig voorkomen. In dat geval is het raadzaam de lijnkaart te vervangen.
U kunt deze fouten in de console-uitvoer zien:
SLOT 6:00:03:53: %PM622-3-SAR_SRAM_PARITY_ERR: (6/0): Parity error in Reassembly SAR SRAM address: 80000000.Resetting the port SLOT 3:00:00:53: %PM622-3- SAR_MULTIBIT_ECC_ERR: (3/0): Multi-bit ECC Uncorrectable error in SAR SDRAM address: 80000000. Resseting the port. SLOT 4:00:00:53: %PM622-3 SAR_SINGLE_BIT_ECC_ERR: (3/0): ECC corrected an error in SAR SDRAM address: 800000. SLOT 0:Jun 25 20:45:53 KST: %EE48-6-ALPHAECC: RX ALPHA: An PLU SDRAM ECC correctable error occured address 1000C254 SLOT 0:Jun 25 20:45:53 KST: %EE48-6-ALPHAECC2: RX ALPHA: An PLU SDRAM ECC multibit error occured at address 1000E254 SLOT 5:Nov 17 09:46:30.171: %EE48-6-ALPHA_PARITY: TX ALPHA: Transient SRAM64 parity corrected error 3E Data 0 100000 Parity bits 0 SLOT 10:Feb 21 16:55:36: %EE48-3-ALPHA_SRAM64_ERR: TX ALPHA: ALPHA_PST_RANGE_ERR error 11003F Data 0 0 Parity bits 0 SLOT 4:Jan 15 06:30:00.942 UTC: %EE48-2-GULF_TX_SRAM_ERROR: ASIC GULF: TX SRAM uncorrectable error detected. Details=0x0000 SLOT 0:Mar 16 19:50:22.464 cst: %EE48-4-QM_ZBT_PARITY: ToFab Address 0xB95E Data 0x1 SLOT 5:May 17 06:17:35.507: %EE48-4-QM_NON_ZBT_PARITY: ToFab Error 0x10000028 SLOT 5:May 17 06:17:53.883: %EE48-4-QM_ZBT_PARITY_TRANSIENT: FrFab Address 0x0 Data 0x7E SLOT 5:May 17 06:17:53.883: %EE48-4- GULF_RX_TB_PARITY_ERROR: ASIC GULF: RX telecom bus parity error on port 0 SLOT 1:Dec 13 00:27:42: %EE48-3-SRAM_PARITY: SRAM parity: Unable to find shadow 281B9EB4 SLOT 0:Aug 4 08:55:37: %EE48-3-QM_PARITY: FrFab Address 0x1859E Data 0x10 SLOT 0:Aug 4 08:55:37: %EE48-3-QM_ERROR: FrFab error register 0x80000.
U kunt de volgende berichten op Engine 4/4+ lijnkaarten tegenkomen:
SLOT 4: %RX192-3-HINTR: status = 0x4000000, mask = 0x3FFFFFFF - Parity error on rx_pbc_mem. -Traceback= 401C37C0 403D8814 400BE1EC SLOT 4: %LC-3-ERR_INTR: Error interrupt occurred -Traceback= 400CE028 400C8DF0 40010A24
of
SLOT 3: %RX192-3-HINTR: status = 0x4000000, mask = 0x3FFFFFFF - Parity error on rx_pbc_mem. -Traceback= 406012E0 406972A0 400C555C %FIB-3-FIBDISABLE: Fatal error, slot 3: IPC failure
of
SLOT 13:Dec 5 07:30:15.272 cst: %HERA-6-PAM_ACL_SBE: PKT CNT MEM Syndrome=0x8 Addr=0x523C SLOT 2:00:03:41: %MCC192-6-RED_PARAM1_SBE: Parameter 1 - Single Bit Error detected and corrected Syndrome = 0x7, Address = 0x43, samebit No, diffbit No SLOT 2:00:03:41: %MCC192-6-RED_PARAM2_SBE: Parameter 1 - Single Bit Error detected and corrected Syndrome = 0x7, Address = 0x43, samebit No, diffbit No SLOT 5:Apr 26 11:56:08.160: %MCC192-3-SDRAM_MBE: Error=0x200 - DIMM1 Syndrome=0x3000 Addr=0x811C3 SLOT 10:Mar 6 05:05:26.965: %RX192-3-ADJ_MEM_MBE: phy addr 0x7905E648, offset 0xBCC9, old ecc 0x0, new ecc 0x0, bit -1, value 0x0 - MBE on Adjacency Memory.. SLOT 13:Dec 5 07:30:15.272 cst: %HERA-6-PAM_ACL_MBE: PKT CNT MEM Syndrome=0x8 Addr=0x523C SLOT 2:00:03:41: %MCC192-6-RED_PARAM1_MBE: Parameter 1 - Single Bit Error detected and corrected Syndrome = 0x7, Address = 0x43, samebit No, diffbit No SLOT 2:00:03:41: %MCC192-3-RED: Error=0x80000 - RED PARAM 1 ECC SBE Error. -Traceback= 405AF5E0 405B1CEC 406DFF7C 406E057C 400FC7E SLOT 2:00:03:41: %MCC192-6-RED_PARAM2_MBE: Parameter 1 - Single Bit Error detected and corrected Syndrome = 0x7, Address = 0x43, samebit No, diffbit No Sep 8 14:32:09 jst: %MEM_ECC-3-SYNDROME_SBE_LIMIT: 8-bit Syndrome for the detected Single-bit error: 0xD5
De symptomen voor deze kwestie zijn onder meer:
Cisco Express Doorsturen op deze lijnkaart wordt uitgeschakeld
De bijbehorende poorten blijven omhoog/omhoog
De lijnkaart kan automatisch worden opnieuw ingesteld
Als de lijnkaart niet opnieuw wordt ingesteld, moet de werkronden de opdracht microcode opnieuw laden <sleuf> uitvoeren:
Dit bericht geeft niet altijd een hardwareprobleem aan met de RX192-module. Sommige IOS-softwarefuncties van Cisco kunnen deze foutmelding als bijwerking produceren. Als dit bericht maar één keer verschijnt, houdt u het bord in de gaten. Het apparaat wordt opnieuw ingesteld. Als het probleem zich blijft voordoen, wordt de kaart automatisch opnieuw ingesteld. Neem contact op met uw Cisco Technical Support vertegenwoordiger voor ondersteuning als dit bericht blijft bestaan.
De SBE gebeurtenissen kunnen op E4/E4+ worden gecontroleerd met de opdracht van de showcontrollers mcc192 ecc:
LC-Slot4#show controllers mcc192 ecc MCC192 SDRAM ECC Counters SBE = 0x0, MBE = 0x0 TX192 SDRAM ECC Counters SBE = 0x0, MBE = 0x0
Dit rapporteert over zowel RX- als TX-geheugen.
U kunt deze fouten in de console-uitvoer zien:
SLOT 1:Jun 26 20:45:53 KST: %EE192-6-WAHOOECC: RX WAHOO: An PLU SDRAM ECC correctable error occured address 20000254 SLOT 9:Sep 2 21:27:49.680 GMT+8: %MCC192-3-PKTMEM_SBE: Single bit error detected and corrected SLOT 14:Jul 18 07:19:24.637: RX_XBMA: 1-bit CPUIM_ECCERR1 error 0x2 SLOT 15:Jan 4 16:53:16.591: TX_XBMA: (1) QSRAM qinfo SBE detected. info: 0x82605455 SLOT 12:Dec 12 22:34:15: %EE192-4-BM_ERRSSS: FrFab BM BADDR ECC ERR info single bit error(s) corrected, error 8250F63E count: 2 SLOT 1:Nov 22 13:40:02 JST: %EE192-3-QM_ERROR: RX_XBMA OQLLM error error register 0x1 -Traceback= 40AE71AC 406078C4 405F5EC0 SLOT 7:001113: Oct 24 10:50:28.520 BST: %EE192-3-WAHOOERRS: RX WAHOO: WAHOO_CSRAM_CNTRL_INT PIPE0 error 8 SLOT 6:Oct 4 16:48:00.487: %EE192-3-WAHOOERRSSS: RX WAHOO: WAHOO_FFCRAM_CNTRL_INT PIPE0 error 4 addr 3FBFAB8 agent 94 SLOT 7:001114: Oct 24 10:50:28.520 BST: %EE192-3-WAHOOERRSSSS: RX WAHOO: WAHOO_PPC_INT PIPE1 error pl_ctl 4000226 pl_aa_avl F9F7B pl_aa_end 7FF9 pl_aa_fatal 4800000 SLOT 6:Oct 4 16:48:00.487: %EE192-3-WAHOOERRS: RX WAHOO WAHOO_NFC_SRAM_MULTI_ECC_ERR multi-bit CSSRAM error SLOT 6:Oct 4 16:48:00.487: %EE192-3-WAHOOERRS: WAHOO_CTCAM_CNTRL_INT multi-bit CSRAM error SLOT 6:Oct 4 16:48:00.487: %EE192-3-WAHOOERRS: WAHOO_FFCRAM_CNTRL_INT MBE SLOT 6:Oct 4 16:48:00.487: %EE192-3-WAHOOERRS: FSRAM not OK WAHOO_FSRAM_CNTRL_INT ECC_1_BIT_EE | ECC_UNCORR_EE SLOT 6:Oct 4 16:48:00.487: %EE192-3-WAHOOERRS: WAHOO_CTCAM_CNTRL_INT multi-bit CSRAM error SLOT 1:00:01:14: WEEKLY_THROTTLE_SOCKEYE_SBE: SOCKEYE SBE: addr: 0xC2A007C0, synd: 0xC4 SLOT 1:00:01:14: WEEKLY_THROTTLE_CBSRAM_SBE_TX+i: CBSRAM SBE TX: 1-bit CBSRAM error. SLOT 1:00:01:14: WEEKLY_THROTTLE_CBSRAM_SBE_RX+i: CBSRAM SBE RX: 1-bit CBSRAM error. SLOT 1:00:01:14: WEEKLY_THROTTLE_CSSRAM_SBE_TX+i: CSSRAM SBE TX: 1-bit CSSRAM error. SLOT 1:00:01:14: WEEKLY_THROTTLE_CSSRAM_SBE_RX+i: CSSRAM SBE RX: 1-bit CSSRAM error. SLOT 1:00:01:14: WEEKLY_THROTTLE_CSRAM_SBE_TX+i: CSRAM SBE TX: 1-bit CSRAM error. SLOT 1:00:01:14: WEEKLY_THROTTLE_CSRAM_SBE_RX+i: CSRAM SBE RX: 1-bit CSRAM error. SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FW_TCAM_PRTY_TX+throttle_i: TX FTCAM PRTY error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FW_TCAM_PRTY_RX+throttle_i: RX FTCAM PRTY error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_CL_TCAM_PRTY_TX+throttle_i: TX CLTCAM PRTY error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_CL_TCAM_PRTY_RX+throttle_i: RX CLTCAM PRTY error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_NF_TCAM_PRTY_TX+throttle_i: TX NFTCAM PRTY error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_NF_TCAM_PRTY_RX+throttle_i: RX NFTCAM PRTY error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_TCAM_PRTY_VMR: TCAM PRTY VMR error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_TCAM_PRTY_NO-VMR: TCAM PRTY NO-VMR error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FCRAM_SBE_TX: FCRAM SBE TX error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FCRAM_SBE_RX: FCRAM SBE TX error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FCRAM_PER_CHIP_SBE_TX: FCRAM CHIP SBE error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_ FCRAM_PER_CHIP_SBE_RX: FCRAM CHIP SBE error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FSRAM_SBE_TX: FSRAM SBE TX error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FSRAM_SBE_RX: FSRAM SBE RX error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_ FSRAM_MBE_TX: FSRAM MBE RX error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_ FSRAM_MBE_RX: FSRAM MBE RX error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_BM_ISERR_TX: ISERR TX error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_BM_ISERR_RX: ISERR RX error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_BM_FCRAM_SBE_TX: FCRAM SBE TX error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_BM_FCRAM_SBE_RX: FCRAM SBE RX error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_QSRAM_LINK_SBE_TX: QSRAM LINK SBE TX error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_QSRAM_LINK_SBE_RX: QSRAM LINK SBE RX error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_QSRAM_QEINFO_SBE_TX: QSRAM queue info sbe tx error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_QSRAM_QEINFO_SBE_TX: QSRAM queue info sbe rx error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_QSRAM_BADDR_SBE_TX: qsram bad addr sbe tx error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_ QM_QSRAM_BADDR_SBE_RX: qsram bad addr sbe rx error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_OQLLM_SBE_TX: oqllm sbe tx error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_OQLLM_SBE_RX: oqllm sbe rx error status = 0x3
U kunt deze fouten in de console-uitvoer zien:
SLOT 0:Jan 14 08:53:44.581 GMT: %FIA-3-RAMECCERR: To Fabric ECC error was detected Single Bit Error RAM2 status = 0x8000 Syndrome = 0x0 addr = 0x0 SLOT 6:Apr 29 09:36:12: %E6LC-4-ECC_THRESHOLD: HERMES VID SBE exceeded threshold, possible memory failure SLOT 4:*Mar 13 23:38:19.295: %E6_RX192-3-MTRIE_SBE: Head1 Syndrome=0x94 Addr=0xFFF2B -Traceback= 40544830 40546A90 40688C94 400EDC18 SLOT 7:*Mar 4 1234:19.295: %E6_RX192-3-ADJ_SBE: Syndrome=0x59 Addr=0xFFF2B -Traceback= 40000830 40036A90 40555D44 400ddd23 SLOT 14:Dec 9 20:02:29: %E6_RX192-6-PBC_SBE: Single bit error detected and corrected RLDRAM Syndrome=0x61 Addr=0xF855 Dec 9 20:02:33: %GRP-4-RSTSLOT: Resetting the card in the slot: 14,Event: linecard error report SLOT 4:06:21:43: %E6_RX192-3-ACL_SBE: ACTION MEM Syndrome=0x7 Addr=0x0 -Traceback= 40549740 4054A7E0 4068D814 400EE018 SLOT 6:Mar 28 03:30:19: %RX192-3-HINTR: status = 0x1000000000000, mask = 0x7FFFFF0FA320F - L3X SBE error. -Traceback= 405816DC 406A1010 406A1650 400F70E8 SLOT 6:Mar 28 03:30:19: %E6_RX192-6-VID_SBE: Single bit error detected and corrected VID memory Syndrome=0x19 Addr=0xE51B SLOT 6:Nov 27 23:32:36: %HERA-3-PKTMEM_SBE: Single bit error detected and corrected Error=0x80 – Syndrome=0x5100000000000000 Addr=0x894620 Data bit116 SLOT 7:Oct 2 23:32:36: %HERA-6- MCD_SBE: Single bit error detected and corrected Error=0x50 – Syndrome=0x3100000000000000 Addr=0x331110 Data bit216 SLOT 1:Jun 22 03:32:36: %HERA-6- MRW_SBE: Single bit error detected and corrected Error=0x50 – Syndrome=0x3100000000000000 Addr=0x331110 Data bit216 SLOT 12:May 24 03:03:36: %HERA-6- UPF_SBE: Single bit error detected and corrected Error=0x60 – Syndrome=0x4100000000000000 Addr=0x451140 Data bit216 SLOT 13:Dec 5 07:30:15.272 cst: %HERA-6-PAM_ACL_SBE: PKT CNT MEM Syndrome=0x8 Addr=0x523C SLOT 9:May 5 18:52:14: %HERA-6-QM_FBF_SBE: Free Block FIFO - Single Bit Error detected and corrected Syndrom = 0x10, Addr = 0x778, samebit Yes, diffbit No SLOT 9:May 5 18:52:14: %HERA-3-QM: Error=0x40 - FBF RAM ECC SBE. -Traceback= 405AD4CC 405AF5D0 405F2E80 406DCDB8 406DD434 400FC500 SLOT 3:Aug 16 00:45:14: %MCC192-6-RED_AQD_SBE: Average Queue Depth - Single Bit Error detected and corrected Syndrome = 0x7, Address = 0x89, samebit No, diffbit No SLOT 2:Jan 23 06:29:56 KST: %MCC192-6-RED_STAT_SBE: Statistics - Single Bit Error detected and corrected Syndrome = 0x38, Address = 0xFF, samebit No, diffbit No SLOT 4:*Mar 13 23:38:19.295: %E6_RX192-3-MTRIE_MBE: Single bit error detected and corrected Head1 Syndrome=0x94 Addr=0xFFF2B SLOT 7:*Mar 4 1234:19.295: %E6_RX192-3-ADJ_MBE: Syndrome=0x59 Addr=0xFFF2B -Traceback= 40000830 40036A90 40555D44 400ddd23 00:00:18: %E6_RX192-3-PBC_MBE: ADJ OBANK LO Syndrome=0xE5 Addr=0x142 -Traceback= 405BF8B0 405C0F08 406E8D78 406E93B8 400FCCE0 SLOT 6:Mar 28 03:30:19: %E6_RX192-6-VID_MBE: Single bit error detected and corrected VID memory Syndrome=0x19 Addr=0xE51B SLOT 0:Apr 18 06:44:53.751 GMT: %HERA-3-PKTMEM_MBE: Error=0x1010 - Syndrome=0x9900000000 SLOT 7:Oct 2 23:32:36: %HERA-6- MCD_MBE: Single bit error detected and corrected Error=0x50 – Syndrome=0x3100000000000000 Addr=0x331110 Data bit216 SLOT 1:Jun 22 03:32:36: %HERA-6- MRW_MBE: Single bit error detected and corrected Error=0x50 - Syndrome=0x3100000000000000 Addr=0x331110 Data bit216 SLOT 13:Dec 5 07:30:15.272 cst: %HERA-6-PAM_ACL_MBE: PKT CNT MEM Syndrome=0x8 Addr=0x523C SLOT 9:May 5 18:52:14: %HERA-6-QM_FBF_MBE: Free Block FIFO - Single Bit Error detected and corrected Syndrome = 0x10, Addr = 0x778, samebit Yes, diffbit No SLOT 3:Aug 16 00:45:14: %MCC192-6-RED_AQD_MBE: Average Queue Depth - Single Bit Error detected and corrected Syndrome = 0x7, Address = 0x89, samebit No, diffbit No SLOT 2:Jan 23 06:29:56 KST: %MCC192-6-RED_STAT_MBE: Statistics - Single Bit Error detected and corrected Syndrome = 0x38, Address = 0xFF, samebit No, diffbit No
U kunt deze fouten in de console-uitvoer zien:
SLOT 7:Jan 4 02:04:00.487: %SPA_CHOC_DSX-3-UNCOR_PARITY_ERR: SPA4/0: CHOC SPA parity error(s) encountered SLOT 7:Jan 4 02:04:00.487: %MCT1E1-3-UNCOR_PARITY_ERR: SPA5/0: T1E1 SPA parity error(s) encountered SLOT 3: 00:33:48: %MCT1E1-3-UNCOR_MEM_ERR: SPA3/0: 1 uncorrectable HDLC SRAM memory error(s) encountered. SLOT 1:Oct 3 14:42:45.727: %SPA_PLIM-4-SBE_ECC: SPA-4XT3/E3[1/2] reports 2 SBE occurrence at 1 addresses SLOT 1: Jul 22 05:26:29.613 UTC: %SPA_DATABUS-3-SPI4_SINGLE_DIP4_PARITY: SIP Sbslt 0 Ingress Sink - A single DIP4 parity error has occurred on the data bus. SLOT 4: Dec 2 22:44:05: %SPA_DATABUS-3-SPI4_SINGLE_DIP2_PARITY: SIP Sbslt 0 Egress Source - A single DIP 2 parity error on the FIFO status bus has occurred. SLOT 1:Oct 3 14:42:45.727: %SPA_PLIM-4-SBE_OVERFLOW: SPA-4XT3/E3[1/2] reports SBE table (2 elements) overflows SLOT 1:Oct 3 14:42:45.727: % SPA_PLUGIN-3-SPI4_SETCB: SPA-4XT3/E3[1/2] : IPC SPI4 set callback failed(status 2).
Alle parity foutmeldingen met betrekking tot switching fabric-kaarten worden in detail behandeld in Hardware Problemen opsporen en verhelpen voor Cisco 12000 Series Internet Router. Deze berichten bevatten (niet-limitatieve lijst):
%FABRIC-3-PARITYERR: To Fabric parity error was detected. Grant parity error Data = 0x2. SLOT 1:%FABRIC-3-PARITYERR: To Fabric parity error was detected. Grant parity error Data = 0x1