المقدمة
يوضح هذا المستند كيفية تحديد مشكلات الذاكرة في بطاقات ASR5K-PSC-32G (Packet Services Card 2 (PSC2)) و ASR5K-PSC-64G (Packet Services Card 3 (PSC3)). والعرض الذي يظهر عندما تكون المشكلة موجودة هو ان البطاقة تعيد ترتيب نفسها. تتوفر جميع المعلومات المطلوبة لاستكشاف الأخطاء وإصلاحها في إظهار تفاصيل الدعم (SSD).
المتطلبات الأساسية
المتطلبات
cisco يوصي أن يتلقى أنت معرفة من ال CLI من التجميع خدمة مسحاج تخديد 5000 (ASR5K).
المكونات المستخدمة
لا يقتصر هذا المستند على إصدارات برامج ومكونات مادية معينة.
تم إنشاء المعلومات الواردة في هذا المستند من الأجهزة الموجودة في بيئة معملية خاصة. بدأت جميع الأجهزة المُستخدمة في هذا المستند بتكوين ممسوح (افتراضي). إذا كانت شبكتك مباشرة، فتأكد من فهمك للتأثير المحتمل لأي أمر.
مشكلات الذاكرة
قد تعطل بطاقة خدمات الحزمة 2 (PSC2) أو بطاقة خدمات الحزمة 3 (PSC3) ether بسبب عطل في kernel أو فقدان لنبضات القلب.
عطل Kernel
يمكن أن يحدث عطل في Kernel عندما تواجه البطاقة أخطاء متعددة في الذاكرة يمكن تصحيحها أو خطأ واحد في الذاكرة غير قابل للتصحيح. لتحديد ما إذا كانت المشكلة هي عطل في kernel، اتبع الخطوات التالية:
- في SSD، تحقق من إظهار قائمة الأعطال لتعطل kernel:
<snip>
******** show crash list *******
== =================== ======= ========== =========== ================
# Time Process Card/CPU/ SW HW_SER_NUM
PID VERSION SMC / Crash Card
== =================== ======= ========== =========== ================
86 2012-Jun-07+18:28:21 sessmgr 15/0/04453 12.2(42876) PLB30103469/PLB40098624
87 2012-Jun-15+04:02:34 kernel 16/0/NA 12.2(NA) PLB30103469/PLB39098500
88 2012-Jun-15+04:50:38 sessmgr 02/0/04372 12.2(42876) PLB30103469/PLB40098609
<snip>
-
بمجرد تحديد رقم عطل kernel، تحقق من تفاصيل العطل لرقم العطل في قائمة الأعطال. في المثال السابق، حدث عطل 87 في البطاقة 16.
<snip>
********************* CRASH #87 ***********************
2.6.38-staros-v3-hw-64 #1 SMP PREEMPT Wed Apr 18 14:32:38 EDT 2012 1 0 PLB39098500 428760, label "": Corrected error (Socket=0 channel=0 dimm=0)
<4>[52569.305831] EDAC MC0: CE row 0, channel 0, label "": Corrected error (Socket=0 channel=0 dimm=0)
<4>[52569.314566] EDAC MC0: CE row 0, channel 0, label "": Corrected error (Socket=0 channel=0 dimm=0)
<4>[52579.321273] edac_mc_handle_fbd_ce: 449 callbacks suppressed
<4>[52579.326820] EDAC MC0: CE row 0, channel 0, label "": Corrected error (Socket=0 channel=0 dimm=0)
…………..
<0>[52668.605978] [Hardware Error]: CPU 0: Machine Check Exception: 4 Bank 8: fe0000000001009f
<0>[52668.614014] [Hardware Error]: TSC 66946ea1b05a ADDR 44f307280 MISC 4c43688800045941
<0>[52668.621767] [Hardware Error]: PROCESSOR 0:106a5 TIME 1339732830 SOCKET 0 APIC 0
<0>[52668.629028] [Hardware Error]: Machine check: Processor context corrupt
<0>[52668.635520] Kernel panic - not syncing: Fatal Machine check
<snip>
يشير "EDAC MC0: CE Row 0، channel 0، label ": الخطأ المصحح" بالإضافة إلى "Kernel Panic' إلى فشل الذاكرة ويتطلب ترخيص المواد المسترجعة (RMA).
لم يتم الكشف عن الذاكرة
قد تتم إعادة تمهيد بطاقة خط PSC2/PSC3 مع الإشارة إلى فقدان دقات القلب. أحد الأسباب هو أن النظام كشف وجود ذاكرة DIMM غير صحيحة. عند اكتشاف DIMM غير صحيح، تحاول البطاقة إعادة التشغيل عدة مرات قبل أن تدخل في حالة عدم الاتصال.
بالنسبة لبطاقة PSC2، في بطاقة وحدة تحكم تصحيح الأخطاء الإخراج × وحدة المعالجة المركزية (CPU) بسرعة xالموجودة في محرك الأقراص المزود بذاكرة مصنوعة من مكونات صلبة (SSD)، ستظهر هذه الأخطاء:
1338537199.891 card 6-cpu0: ERROR: Memory size 24576 MB for cpu0 not matching with value 32768 MB in IDEEPROM 1338537199.891 card 6-cpu0:
1338537199.891 card 6-cpu0: ERROR: Bus 255 CPU 0 Chan 0 DIMM 0 NotPresent
أيضا، ال syslog سيتم تعبئته مع هذا خطأ:
The Packet Services Card 2 with serial number SAD154403TT in slot 6 has failed and will be brought down and brought back online. (Device=CPU_0, Reason=CARD_BOOT_TIMEOUT_EXPIRED, Status=[CPU0 MB: CFE_FAILURE] [CPU1] [CPU2] [CPU3] [GPIO_IN: 00,ff,ff,ff] [GPIO_OUT: 01,ff,00,ff]
بالنسبة لبطاقة PSC3، في بطاقة وحدة تحكم تصحيح الأخطاء الإخراج، × وحدة المعالجة المركزية (CPU0) التي تم العثور عليها في محرك الأقراص المزود بذاكرة مصنوعة من مكونات صلبة (SSD)، سيتم ملاحظة هذا الخطأ:
1412147713.299 card 7-cpu0: WARNING: Memory size 49152 MB for cpu0 not matching with value 65536 MB in IDEEPROM
يجب إستبدال البطاقة التي تواجه هذه المشكلة.