تسعى مجموعة الوثائق لهذا المنتج جاهدة لاستخدام لغة خالية من التحيز. لأغراض مجموعة الوثائق هذه، يتم تعريف "خالية من التحيز" على أنها لغة لا تعني التمييز على أساس العمر، والإعاقة، والجنس، والهوية العرقية، والهوية الإثنية، والتوجه الجنسي، والحالة الاجتماعية والاقتصادية، والتمييز متعدد الجوانب. قد تكون الاستثناءات موجودة في الوثائق بسبب اللغة التي يتم تشفيرها بشكل ثابت في واجهات المستخدم الخاصة ببرنامج المنتج، أو اللغة المستخدمة بناءً على وثائق RFP، أو اللغة التي يستخدمها منتج الجهة الخارجية المُشار إليه. تعرّف على المزيد حول كيفية استخدام Cisco للغة الشاملة.
ترجمت Cisco هذا المستند باستخدام مجموعة من التقنيات الآلية والبشرية لتقديم محتوى دعم للمستخدمين في جميع أنحاء العالم بلغتهم الخاصة. يُرجى ملاحظة أن أفضل ترجمة آلية لن تكون دقيقة كما هو الحال مع الترجمة الاحترافية التي يقدمها مترجم محترف. تخلي Cisco Systems مسئوليتها عن دقة هذه الترجمات وتُوصي بالرجوع دائمًا إلى المستند الإنجليزي الأصلي (الرابط متوفر).
يصف هذا المستند تقنيات أستكشاف أخطاء أجهزة Nexus 7000 (N7K) وإصلاحها.
يعرض هذا أمر حالة وحدة المروحة النمطية على المحول.
SITE1-AGG1# show environment fan Fan: ------------------------------------------------------ Fan Model Hw Status ------------------------------------------------------ Fan1(sys_fan1) N7K-C7010-FAN-S 1.1 Ok Fan2(sys_fan2) N7K-C7010-FAN-S 1.1 Ok Fan3(fab_fan1) N7K-C7010-FAN-F 1.1 Ok Fan4(fab_fan2) N7K-C7010-FAN-F 1.1 Ok Fan_in_PS1 -- -- Ok Fan_in_PS2 -- -- Ok Fan_in_PS3 -- -- Shutdown Fan Zone Speed: Zone 1: 0x78 Zone 2: 0x58 Fan Air Filter : Present
يمكن أن تكون حالة المروحة واحدة من الحالات "موافق" أو "فاشل" أو "غائب".
“Fan module removed. Fan module has been absent for 120 seconds"
يعرض هذا الأمر وحدات التزويد بالطاقة المثبتة وملخص إستخدام الطاقة وحالة وحدات التزويد بالطاقة على المحول.
يتم توفير الأمر وكذلك نموذج للمخرجات.
SITE1-AGG1# show environment power Power Supply: Voltage: 50 Volts Power Actual Total Supply Model Output Capacity Status (Watts ) (Watts ) ------- ------------------- ----------- ----------- -------------- 1 N7K-AC-6.0KW 1179 W 6000 W Ok 2 N7K-AC-6.0KW 1117 W 6000 W Ok 3 N7K-AC-6.0KW 0 W 0 W Shutdown Actual Power Module Model Draw Allocated Status (Watts ) (Watts ) ------- ------------------- ----------- ----------- -------------- 1 N7K-M148GT-11 N/A 400 W Powered-Up 3 N7K-M132XP-12 N/A 750 W Powered-Up 4 N7K-F132XP-15 318 W 385 W Powered-Up 5 N7K-SUP1 N/A 210 W Powered-Up 6 N7K-SUP1 N/A 210 W Powered-Up 10 N7K-M132XP-12L 535 W 750 W Powered-Up Xb1 N7K-C7010-FAB-1 N/A 80 W Powered-Up Xb2 N7K-C7010-FAB-1 N/A 80 W Powered-Up Xb3 N7K-C7010-FAB-1 N/A 80 W Powered-Up Xb4 xbar N/A 80 W Absent Xb5 xbar N/A 80 W Absent fan1 N7K-C7010-FAN-S 133 W 720 W Powered-Up fan2 N7K-C7010-FAN-S 133 W 720 W Powered-Up fan3 N7K-C7010-FAN-F 12 W 120 W Powered-Up fan4 N7K-C7010-FAN-F 12 W 120 W Powered-Up N/A - Per module power not available Power Usage Summary: -------------------- Power Supply redundancy mode (configured) PS-Redundant Power Supply redundancy mode (operational) Non-Redundant Total Power Capacity (based on configured mode) 12000 W Total Power of all Inputs (cumulative) 12000 W Total Power Output (actual draw) 2296 W Total Power Allocated (budget) 4785 W Total Power Available for additional modules 7215 W
يمكن أن تكون حالة وحدة التزويد بالطاقة إحدى الخيارات التالية:
حالات فشل وحدة التزويد بالطاقة:
تحتوي كل وحدة للتزويد بالطاقة على مؤشر LED يشير إلى حالة إخراج الطاقة. ويتم التحكم في مؤشر LED هذا بشكل مباشر عن طريق مصدر الطاقة، ويشير اللون الأحمر إلى حدوث عطل في مصدر الطاقة. عند فحص syslog، قد تظهر رسائل بديلة حول فشل وحدة إمداد الطاقة واستردادها، مما يشير كذلك إلى وجود مشاكل متعلقة بوحدة إمداد الطاقة.
كل بطاقة في الهيكل لها إثنان على الأقل من أجهزة إستشعار درجة الحرارة. يتم تكوين كل مستشعر لدرجة الحرارة باستخدام حد ثانوي وعتبة رئيسية. يوضح هذا الأمر مع إخراج عينة كيف يمكن إسترداد معلومات درجة الحرارة من المحول:
SITE1-AGG1# show environment temperature Temperature: -------------------------------------------------------------------- Module Sensor MajorThresh MinorThres CurTemp Status (Celsius) (Celsius) (Celsius) -------------------------------------------------------------------- 1 Crossbar(s5) 105 95 46 Ok 1 CTSdev4 (s9) 115 105 56 Ok 1 CTSdev5 (s10) 115 105 57 Ok 1 CTSdev7 (s12) 115 105 56 Ok 1 CTSdev9 (s14) 115 105 53 Ok 1 CTSdev10(s15) 115 105 53 Ok 1 CTSdev11(s16) 115 105 52 Ok 1 CTSdev12(s17) 115 105 51 Ok 1 QEng1Sn1(s18) 115 105 51 Ok 1 QEng1Sn2(s19) 115 105 50 Ok 1 QEng1Sn3(s20) 115 105 48 Ok 1 QEng1Sn4(s21) 115 105 48 Ok 1 L2Lookup(s22) 120 110 47 Ok 1 L3Lookup(s23) 120 110 54 Ok 3 Crossbar(s5) 105 95 50 Ok 3 QEng1Sn1(s12) 115 110 69 Ok 3 QEng1Sn2(s13) 115 110 67 Ok 3 QEng1Sn3(s14) 115 110 66 Ok 3 QEng1Sn4(s15) 115 110 67 Ok 3 QEng2Sn1(s16) 115 110 70 Ok 3 QEng2Sn2(s17) 115 110 67 Ok 3 QEng2Sn3(s18) 115 110 66 Ok 3 QEng2Sn4(s19) 115 110 67 Ok 3 L2Lookup(s27) 115 105 51 Ok 3 L3Lookup(s28) 120 110 64 Ok 4 Crossbar1(s1) 105 95 69 Ok 4 Crossbar2(s2) 105 95 52 Ok 4 L2dev1(s3) 105 95 37 Ok 4 L2dev2(s4) 105 95 43 Ok 4 L2dev3(s5) 105 95 45 Ok 4 L2dev4(s6) 105 95 45 Ok 4 L2dev5(s7) 105 95 40 Ok 4 L2dev6(s8) 105 95 41 Ok 4 L2dev7(s9) 105 95 42 Ok 4 L2dev8(s10) 105 95 40 Ok 4 L2dev9(s11) 105 95 38 Ok 4 L2dev10(s12) 105 95 38 Ok 4 L2dev11(s13) 105 95 38 Ok 4 L2dev12(s14) 105 95 37 Ok 4 L2dev13(s15) 105 95 34 Ok 4 L2dev14(s16) 105 95 33 Ok 4 L2dev15(s17) 105 95 33 Ok 4 L2dev16(s18) 105 95 32 Ok 5 Intake (s3) 60 42 24 Ok 5 EOBC_MAC(s4) 105 95 42 Ok 5 CPU (s5) 105 95 42 Ok 5 Crossbar(s6) 105 95 47 Ok 5 Arbiter (s7) 110 100 55 Ok 5 CTSdev1 (s8) 115 105 44 Ok 5 InbFPGA (s9) 105 95 43 Ok 5 QEng1Sn1(s10) 115 105 48 Ok 5 QEng1Sn2(s11) 115 105 46 Ok 5 QEng1Sn3(s12) 115 105 44 Ok 5 QEng1Sn4(s13) 115 105 44 Ok 6 Intake (s3) 60 42 24 Ok 6 EOBC_MAC(s4) 105 95 40 Ok 6 CPU (s5) 105 95 36 Ok 6 Crossbar(s6) 105 95 45 Ok 6 Arbiter (s7) 110 100 52 Ok 6 CTSdev1 (s8) 115 105 43 Ok 6 InbFPGA (s9) 105 95 43 Ok 6 QEng1Sn1(s10) 115 105 53 Ok 6 QEng1Sn2(s11) 115 105 51 Ok 6 QEng1Sn3(s12) 115 105 48 Ok 6 QEng1Sn4(s13) 115 105 48 Ok 10 Crossbar(s5) 105 95 46 Ok 10 QEng1Sn1(s12) 115 110 65 Ok 10 QEng1Sn2(s13) 115 110 62 Ok 10 QEng1Sn3(s14) 115 110 64 Ok 10 QEng1Sn4(s15) 115 110 65 Ok 10 QEng2Sn1(s16) 115 110 65 Ok 10 QEng2Sn2(s17) 115 110 63 Ok 10 QEng2Sn3(s18) 115 110 64 Ok 10 QEng2Sn4(s19) 115 110 65 Ok 10 L2Lookup(s27) 115 105 51 Ok 10 L3Lookup(s28) 120 110 71 Ok xbar-1 Intake (s2) 60 42 27 Ok xbar-1 Crossbar(s3) 105 95 55 Ok xbar-2 Intake (s2) 60 42 25 Ok xbar-2 Crossbar(s3) 105 95 49 Ok xbar-3 Intake (s2) 60 42 26 Ok xbar-3 Crossbar(s3) 105 95 47 Ok
يوضع مستشعر الإدخال عند مدخل تدفق الهواء وهو أهم مؤشر على درجة حرارة البطاقة. يتم إتخاذ جميع إجراءات البرامج استنادا إلى حدوث انتهاك كبير لدرجة الحرارة لمستشعر الإدخال.
وهذا يؤدي إلى ظهور رسالة syslog وحدث callHome وملائمة بروتوكول إدارة الشبكة البسيط (SNMP). تتم طباعة رسائل الأولوية 1 أو 2 هذه في syslog - تم الإبلاغ عن الوحدة النمطية 1 بالإنذار الرئيسي لدرجة الحرارة (المستشعر - الفهرس 1 لدرجة الحرارة 76).
يتم إيقاف تشغيل بطاقة الخط على الفور مع رسالة syslog هذه ذات الأولوية 0 - تم إيقاف تشغيل الوحدة النمطية 1 بسبب تنبيه درجة الحرارة الرئيسي.
المشرف المتكرر يتم إيقاف تشغيله على الفور. سيؤدي ذلك إلى تبديل وحدة التحكم أو إيقاف تشغيل وحدة الاستعداد، وفقا للمشرف المعين الذي قام بانتهاك الحد. يتم عرض رسالة الأولوية 0 syslog هذه - تم إيقاف تشغيل الوحدة النمطية 1 بسبب تنبيه درجة الحرارة الرئيسي.
وفي بعض الأحيان تتعطل أجهزة إستشعار درجات الحرارة ويصبح الوصول إليها متعذرا. لم يتم إتخاذ إجراء برنامج صريح لهذا الشرط. يتم طباعة رسالة الأولوية 4 syslog هذه - فشل مستشعر درجة الحرارة للوحدة النمطية 1.
يتضمن تصحيح أخطاء إعادة تعيين/إعادة تحميل مستوى محول/مشرف بشكل خاص البحث في معلومات تصحيح الأخطاء/السجل المخزنة على ذاكرة الوصول العشوائي غير المتطايرة (NVRAM) على المشرف. هناك 3 أنواع من معلومات تصحيح الأخطاء/السجل موجودة في ذاكرة NVRAM والتي قد تحتوي على بعض المعلومات المهمة.
1.1 سبب إعادة التعيين
يتم تخزين أسباب إعادة التعيين على Supervisor NVRAM على كل مشرف. يقوم كل مشرف بتخزين سبب إعادة التعيين الخاص به. بعد ظهور المحول، يمكن التخلص من أسباب إعادة الضبط باستخدام أمر CLI هذا. يتم توفير نموذج للمخرجات.
SITE1-AGG1# show system reset-reason ----- reset reason for Supervisor-module 5 (from Supervisor in slot 5) --- 1) No time Reason: Unknown Service: Version: 6.1(2) 2) No time Reason: Unknown Service: Version: 6.1(1) 3) At 246445 usecs after Wed Nov 7 21:26:59 2012 Reason: Reset triggered due to Switchover Request by User Service: SAP(93): Swover due to install Version: 6.1(2) 4) At 36164 usecs after Tue Nov 6 01:18:15 2012 Reason: Reset Requested by CLI command reload Service: Version: 5.2(1) ----- reset reason for Supervisor-module 5 (from Supervisor in slot 6) --- 1) At 939785 usecs after Wed Nov 7 22:28:36 2012 Reason: Reset due to upgrade Service: Version: 6.1(1) 2) At 687128 usecs after Thu Mar 29 18:06:34 2012 Reason: Reset of standby by active sup due to sysmgr timeout Service: Version: 6.0(2) 3) At 10012 usecs after Thu Mar 29 17:56:13 2012 Reason: Reset of standby by active sup due to sysmgr timeout Service: Version: 6.0(2) 4) At 210045 usecs after Thu Mar 29 17:45:51 2012 Reason: Reset of standby by active sup due to sysmgr timeout Service: Version: 6.0(2) ----- reset reason for Supervisor-module 6 (from Supervisor in slot 5) --- 1) At 50770 usecs after Wed Nov 7 21:12:19 2012 Reason: Reset due to upgrade Service: Version: 6.1(2) 2) At 434294 usecs after Mon Nov 5 22:10:16 2012 Reason: Reset due to upgrade Service: Version: 5.2(1) 3) At 518 usecs after Mon Nov 5 21:21:51 2012 Reason: Reset Requested by CLI command reload Service: Version: 5.2(7) 4) At 556934 usecs after Mon Nov 5 21:12:15 2012 Reason: Reset due to upgrade Service: Version: 5.2(1) ----- reset reason for Supervisor-module 6 (from Supervisor in slot 6) --- 1) No time Reason: Unknown Service: Version: 6.1(2) 2) At 462775 usecs after Wed Nov 7 22:38:44 2012 Reason: Reset triggered due to Switchover Request by User Service: SAP(93): Swover due to install Version: 6.1(1) 3) No time Reason: Unknown Service: Version: 6.1(2) 4) No time Reason: Unknown Service: Version: 5.2(1)
يتم حفظ وعرض ما يصل إلى آخر 4 أسباب لإعادة التعيين. يحتوي سبب إعادة التعيين على:
في بعض الأحيان يتم عرض سبب إعادة تعيين "مجهول". يتم تصنيف أسباب إعادة التعيين غير المعروفة للبرامج أو التي تتجاوز التحكم في البرامج على أنها غير معروفة. وتشمل هذه عادة:
1.2 NVRAM Syslog
كما يتم تسجيل دخول رسائل syslog التي تكون ذات أولوية 0 و 1 و 2 إلى ذاكرة NVRAM الخاصة بالمشرف. بعد ظهور المحول مرة أخرى عبر الإنترنت، يمكن عرض رسائل syslog في ذاكرة NVRAM باستخدام هذا الأمر. يتم عرض الأمر وعينة مخرجات:
SITE1-AGG1# show log nvram 2012 Nov 17 05:59:51 SITE1-AGG1 %$ VDC-1 %$ %SYSMGR-STANDBY-2-LAST_CORE_BASIC_TRACE: : PID 15681 with message 'Core detected due to hwclock crash'. 2012 Nov 17 12:07:11 SITE1-AGG1 %$ VDC-1 %$ %CMPPROXY-2-LOG_CMP_UP: Connectivity Management processor(on module 5) is now UP 2012 Nov 17 12:07:56 SITE1-AGG1 %$ VDC-1 %$ %VDC_MGR-2-VDC_ONLINE: vdc 1 has come online 2012 Nov 17 12:07:58 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-PS_OK: Power supply 1 ok (Serial number DTM131000A4) 2012 Nov 17 12:07:58 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-PS_FANOK: Fan in Power supply 1 ok 2012 Nov 17 12:07:58 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-PS_OK: Power supply 2 ok (Serial number DTM140700HS) 2012 Nov 17 12:07:58 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-PS_FANOK: Fan in Power supply 2 ok 2012 Nov 17 12:07:58 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-PS_DETECT: Power supply 3 detected but shutdown (Serial number DTM1413004P) 2012 Nov 17 12:07:59 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-XBAR_DETECT: Xbar 1 detected (Serial number JAF1308ABCS) 2012 Nov 17 12:08:01 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-XBAR_DETECT: Xbar 2 detected (Serial number JAB120600NX) 2012 Nov 17 12:08:02 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-XBAR_DETECT: Xbar 3 detected (Serial number JAF1508AJHN) 2012 Nov 17 12:08:04 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-MOD_DETECT: Module 1 detected (Serial number JAB121602HP) Module-Type 10/100/1000 Mbps Ethernet Module Model N7K-M148GT-11 2012 Nov 17 12:08:04 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-MOD_PWRUP: Module 1 powered up (Serial number JAB121602HP) 2012 Nov 17 12:08:11 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-MOD_DETECT: Module 3 detected (Serial number JAF1441BSED) Module-Type 10 Gbps Ethernet Module Model N7K-M132XP-12 2012 Nov 17 12:08:11 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-MOD_DETECT: Module 4 detected (Serial number JAF1542ABML) Module-Type 1/10 Gbps Ethernet Module Model N7K-F132XP-15 2012 Nov 17 12:08:12 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-MOD_PWRUP: Module 3 powered up (Serial number JAF1441BSED) 2012 Nov 17 12:08:12 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-MOD_PWRUP: Module 4 powered up (Serial number JAF1542ABML) 2012 Nov 17 12:08:15 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-MOD_DETECT: Module 10 detected (Serial number JAF1521BNMK) Module-Type 10 Gbps Ethernet XL Module Model N7K-M132XP-12L 2012 Nov 17 12:08:15 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-MOD_PWRUP: Module 10 powered up (Serial number JAF1521BNMK) 2012 Nov 17 12:08:30 SITE1-AGG1 %$ VDC-1 %$ %CMPPROXY-STANDBY-2-LOG_CMP_UP: Connectivity Management processor(on module 6) is now UP 2012 Nov 17 12:08:33 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-FANMOD_FAN_OK: Fan module 1 (Fan1(sys_fan1) fan) ok 2012 Nov 17 12:08:33 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-FANMOD_FAN_OK: Fan module 2 (Fan2(sys_fan2) fan) ok 2012 Nov 17 12:08:33 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-FANMOD_FAN_OK: Fan module 3 (Fan3(fab_fan1) fan) ok 2012 Nov 17 12:08:33 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-FANMOD_FAN_OK: Fan module 4 (Fan4(fab_fan2) fan) ok 2012 Nov 17 12:11:40 SITE1-AGG1 %$ VDC-1 %$ %VDC_MGR-2-VDC_ONLINE: vdc 2 has come online 2012 Nov 17 12:12:31 SITE1-AGG1 %$ VDC-1 %$ %VDC_MGR-2-VDC_ONLINE: vdc 3 has come online 2012 Nov 17 12:13:21 SITE1-AGG1 %$ VDC-1 %$ %VDC_MGR-2-VDC_ONLINE: vdc 4 has come online 2012 Nov 17 13:10:33 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-MOD_TEMPMINALRM: Xbar-1 reported minor temperature alarm. Sensor=2 Temperature=43 MinThreshold=42 2012 Nov 17 19:56:35 SITE1-AGG1 %$ VDC-1 %$ %PLATFORM-2-MOD_TEMPOK: Xbar-1 recovered from minor temperature alarm. Sensor=2 Temperature=41 MinThreshold=42
قد يوفر مسح ذاكرة NVRAM syslog بعض المعلومات الإضافية حول الفشل المحدد الذي تسبب في إعادة تحميل/إعادة تعيين المحول/المشرف.
سجل إستثناء الوحدة النمطية 1.3
سجل إستثناء الوحدة النمطية هو سجل التفاف مكون من جميع الأخطاء والظروف الاستثنائية على كل وحدة نمطية. بعض الاستثناءات كارثية، وبعضها يؤثر جزئيا على منافذ معينة في وحدة نمطية، والبعض الآخر لأغراض التحذير. يحتوي كل إدخال سجل على الجهاز المعين الذي قام بتسجيل الاستثناء، مستوى الاستثناء، رمز الخطأ، المنافذ المتأثرة، الطابع الزمني. يتم تخزين سجل الاستثناءات في ذاكرة NVRAM على المشرف ويمكن عرضه باستخدام أمر CLI هذا. يتم توفير نموذج للمخرجات.
SITE1-AGG1# show module internal exceptionlog ********* Exception info for module 1 ******** exception information --- exception instance 1 ---- Module Slot Number: 1 Device Id : 10 Device Name : eobc Device Errorcode : 0xc0005043 Device ID : 00 (0x00) Device Instance : 05 (0x05) Dev Type (HW/SW) : 00 (0x00) ErrNum (devInfo) : 67 (0x43) System Errorcode : 0x4042004d EOBC link failure Error Type : Warning PhyPortLayer : Ethernet Port(s) Affected : none DSAP : 0 (0x0) UUID : 0 (0x0) Time : Mon Nov 5 20:39:38 2012 (Ticks: 5098948A jiffies) exception information --- exception instance 2 ---- Module Slot Number: 1 Device Id : 10 Device Name : eobc Device Errorcode : 0xc0005047 Device ID : 00 (0x00) Device Instance : 05 (0x05) Dev Type (HW/SW) : 00 (0x00) ErrNum (devInfo) : 71 (0x47) System Errorcode : 0x4042004e EOBC heartbeat failure Error Type : Warning PhyPortLayer : Ethernet Port(s) Affected : none DSAP : 0 (0x0) UUID : 0 (0x0) Time : Mon Nov 5 20:39:37 2012 (Ticks: 50989489 jiffies)
يوفر سجل الاستثناء معلومات هامة لاستكشاف الأخطاء وإصلاحها وحالات الاستثناء. يتم سرد بعض معرفات الأجهزة هنا.
#define DEV_LINECARD_CTRL 1 #define DEV_SAHARA_FPGA 2 #define DEV_RIVIERA_ASIC 3 #define DEV_LUXOR_ASIC 4 #define DEV_FRONTIER_U_ASIC 5 #define DEV_FRONTIER_D_ASIC 6 #define DEV_ALADDIN_ASIC 7 #define DEV_SSA_ASIC 8 #define DEV_MIRAGE_ASIC 9 #define DEV_EOBC_MAC 10 #define DEV_SUPERVISOR_CTRL 11 #define DEV_BELLAGIO_ASIC 12 #define DEV_SIBYTE 13 #define DEV_FLAMINGO 14 #define DEV_FATW_CTRL 15 #define DEV_MGMT_MAC 16 #define DEV_MOD_RDN_CTRL 17 #define DEV_MOD_ENV 18 #define DEV_GG_FPGA 19 #define DEV_BALLY_MAIN_BOARD 20 #define DEV_BALLY_DAUGHTER_CARD 21 #define DEV_LOCAL_SSO_ASIC 22 #define DEV_REMOTE_SSO_ASIC 23 #define DEV_ID_UD_FIX_FPGA 24 #define DEV_ID_PM_FPGA 25 // PM - Power Mngmnt #define DEV_ID_SUP_XBUS2 26 #define DEV_MARRIOTT_FPGA 27 #define DEV_REUSE_ME 28 #define DEV_GBIC 29 #define DEV_XGFC_FPGA 30 #define DEV_GNN_FPGA 31 #define DEV_SIBYTE_MEM_EPLD 32 #define DEV_BATTERY 33 #define DEV_IDE_DISK 45 #define DEV_XCVR 46 #define DEV_LINECARD 48 #define DEV_TEMP_SENSOR 49 #define DEV_HIFN_COMP 50 #define DEV_X2 51
في هيكل محول البيانات متعدد الطبقات (MDS)، يتم جلب وحدات المشرف بشكل مختلف قليلا عن وحدات بطاقة الخط. عندما يكون هناك مشرفان موجودين في النظام ويكون النظام قيد التشغيل، فإن أحد المشرفين سيصبح نشطا بينما سيصبح الثاني في وضع الاستعداد. إن إعداد المشرف النشط وإظهار المشرف الاحتياطي مختلفان وتتم مناقشتهما هنا.
في حالة عدم وجود مشرف نشط في النظام، سيقوم المشرف الذي يقوم بالتمهيد بالإعداد الافتراضي للمشرف النشط. إن عملية تسمى مدير النظام مسؤولة عن تحميل جميع مكونات البرامج بطريقة منظمة على المشرف. أحد مكونات البرامج الأولى التي يتم تشغيلها على المشرف هو مدير النظام الأساسي. سيقوم هذا المكون بتحميل جميع برامج تشغيل kernel والمصافحة باستخدام مدير النظام. عند تحقيق النجاح، سيمضي مدير النظام قدما ويبدأ في تنفيذ باقي العمليات على أساس الاعتماد الداخلي بين العمليات.
من منظور مدير الوحدة النمطية، المشرف مثل وحدة بطاقة خط أخرى مع إختلافات ضئيلة. عندما يشير مدير النظام الأساسي إلى مدير الوحدة النمطية أن المشرف فوق، فإن مدير الوحدة النمطية لا ينتظر التسجيل. وبدلا من ذلك، فإنه يقوم بإعلام جميع مكونات البرامج التي يقوم المشرف بتشغيلها (المعروف أيضا باسم تسلسل إدخال Sup). ستقوم جميع المكونات بتكوين المشرف. إذا عاد أي مكون به عطل، فسيتم إعادة تشغيل المشرف.
في حالة وجود مشرف نشط في النظام، فإن المشرف الذي يقوم بالتمهيد سوف يكون افتراضيا في حالة المشرف في وضع الاستعداد. يحتاج المشرف الاحتياطي إلى نسخ حالة المشرف النشط. ويتم تحقيق ذلك من خلال "مدير النظام" في الوضع النشط، مما يعمل على بدء مزامنة (مزامنة عامة) لحالة المشرف النشطة إلى المشرف في وضع الاستعداد. بمجرد مزامنة جميع المكونات الموجودة في وضع الاستعداد مع تلك الخاصة بالمشرف النشط، يتم إعلام مدير الوحدة النمطية بأن المشرف في وضع الاستعداد قيد التشغيل.
سيعمل مدير الوحدة النمطية الآن على إعلام جميع مكونات البرامج الموجودة على المشرف النشط لتكوين المشرف في وضع الاستعداد (المعروف أيضا باسم "تسلسل إدخال SUP في وضع الاستعداد"). أي أخطاء من أي مكون أثناء تسلسل إدخال SUP في وضع الاستعداد ستؤدي إلى إعادة تشغيل المشرف في وضع الاستعداد.
يحتفظ MDS بالكثير من معلومات تصحيح الأخطاء أثناء وقت التشغيل. ولكن، كلما قام المشرف بإعادة تمهيد الكثير من معلومات تصحيح الأخطاء يتم فقدانها. ومع ذلك، يتم تخزين جميع المعلومات الهامة في ذاكرة الوصول العشوائي غير المتطايرة، والتي يمكن إستخدامها لإعادة بناء الفشل. عند إعادة تمهيد Supervisor (المشرف) في الوضع النشط، لا يمكن الحصول على المعلومات المخزنة في ذاكرة NVRAM الخاصة به حتى يتم إعادتها مرة أخرى. بمجرد عودة المشرف مرة أخرى، يمكن إستخدام هذه الأوامر لتفريغ السجل المستمر:
المحول# عرض ذاكرة NVRAM للتسجيل
المحول# إظهار سبب إعادة تعيين النظام
Switch# عرض سجل الاستثناءات الداخلي للوحدة النمطية
مثال 1: إعادة تشغيل خدمة Sup النشطة (بسبب تعطل عملية المشرف)
في هذا المثال، تعطلت عملية المشرف (الخدمة "xbar") مما تسبب في إعادة تمهيد خدمة sup النشطة. عندما يعود المشرف مرة أخرى، المعلومات المخزنة في سبب إعادة الضبط تعطي إشارة واضحة، لإعادة تشغيل المشرف.
switch# show system reset-reason ----- reset reason for module 6 ----- 1) At 94009 usecs after Tue Sep 27 18:52:13 2005 Reason: Reset triggered due to HA policy of Reset Service: Service "xbar" Version: 2.1(2)
في حالة وجود مشرف إحتياطي في النظام، يصبح المشرف الاحتياطي الآن مشرفا نشطا. سيؤدي عرض معلومات syslog على المشرف في وضع الاستعداد أيضا إلى توفير المعلومات نفسها (على الرغم من أنها غير صريحة مثل "show system reset-reason").
Switch# show logging 2005 Sep 27 18:58:05 172.20.150.204 %SYSMGR-3-SERVICE_CRASHED: Service "xbar" (PID 1225) hasn't caught signal 9 (no core). 2005 Sep 27 18:58:06 172.20.150.204 %SYSMGR-3-SERVICE_CRASHED: Service "xbar" (PID 2349) hasn't caught signal 9 (no core). 2005 Sep 27 18:58:06 172.20.150.204 %SYSMGR-3-SERVICE_CRASHED: Service "xbar" (PID 2352) hasn't caught signal 9 (no core).
المثال 2: إعادة تشغيل خدمة Sup النشطة (بسبب فشل تشخيص وقت التشغيل)
في هذا المثال، المشرف في slot-6 نشط والحكم على المشرف يبلغ عن خطأ فادح. عندما يبلغ أي جهاز عن خطأ فادح، تتم إعادة تمهيد الوحدة النمطية التي تحتوي على الجهاز. في هذه الحالة يتم إعادة تمهيد المشرف النشط. إذا كان هناك مشرف في وضع الاستعداد، فسيتولى المشرف في وضع الاستعداد الأمر. سيكون لرسائل syslog على المشرف في وضع الاستعداد وسجل الاستثناءات معلومات لتحديد مصدر الخطأ.
Switch# show logging 2005 Sep 28 14:17:47 172.20.150.204 %XBAR-5-XBAR_STATUS_REPORT: Module 6 reported status for component 12 code 0x60a02. 2005 Sep 28 14:17:59 172.20.150.204 %PORT-5-IF_UP: Interface mgmt0 on slot 5 is up 2005 Sep 28 14:18:00 172.20.150.204 %CALLHOME-2-EVENT: SUP_FAILURE switch# show module internal exceptionlog module 6 ********* Exception info for module 6 ******** exception information --- exception instance 1 ---- device id: 12 device errorcode: 0x80000020 system time: (1127917068 ticks) Wed Sep 28 14:17:48 2005 error type: FATAL error Number Ports went bad: 1,2,3,4,5,6 exception information --- exception instance 2 ---- device id: 12 device errorcode: 0x00060a02 system time: (1127917067 ticks) Wed Sep 28 14:17:47 2005 error type: Warning Number Ports went bad: 1,2,3,4,5,6
بالإضافة إلى ذلك، عند دخول خدمة إعادة التشغيل sup التي تمت إعادة تشغيلها مرة أخرى عبر الإنترنت، سوف يحتوي show system reset-reason" على معلومات ذات صلة أيضا. في هذه الحالة تمت إعادة تمهيد الوحدة النمطية 6 (والتي كانت sup النشطة) بواسطة SAP 48 مع رمز الخطأ 0x8000020. يمكن الحصول على العملية التي تملك هذا SAP بواسطة الأمر "show system internal mts sup sap 48 description" الذي يقول إن العملية كانت xbar-manager.
switch(standby)# show system reset-reason ----- reset reason for module 6 ----- 1) At 552751 usecs after Wed Sep 28 14:17:48 2005 Reason: Reset Requested due to Fatal Module Error Service: lcfail:80000020 sap:48 node:060 Version: 2.1(2)
المثال 3: فشل وصول SUP الاحتياطي إلى الإنترنت
في هذا المثال، تم تشغيل خدمة sup النشطة، كما تم توصيل خدمة sup الاحتياطية بالنظام. ومع ذلك، لا يشير عرض الوحدة النمطية إلى أنها قد ظهرت في أي وقت.
switch# show module Mod Ports Module-Type Model Status --- ----- -------------------------------- ------------------ ------------ 5 0 Supervisor/Fabric-1 DS-X9530-SF1-K9 active * 8 8 IP Storage Services Module powered-dn Mod Sw Hw World-Wide-Name(s) (WWN) --- ----------- ------ -------------------------------------------------- 5 2.1(2) 1.1 -- Mod MAC-Address(es) Serial-Num --- -------------------------------------- ---------- 5 00-0b-be-f7-4d-1c to 00-0b-be-f7-4d-20 JAB070307XG
ومع ذلك، إذا قمت بتسجيل الدخول إلى وحدة التحكم الخاصة بمجموعة الدعم الاحتياطية، فهذا يعني أنها في وضع الاستعداد.
runlog>telnet sw4-ts 2004 Trying 172.22.22.55... Connected to sw4-ts.cisco.com (172.22.22.55). Escape character is '^]'. MDS Switch login: admin Password: Cisco Storage Area Networking Operating System (SAN-OS) Software TAC support: http://www.cisco.com/tac Copyright (c) 2002-2005, Cisco Systems, Inc. All rights reserved. The copyrights to certain works contained herein are owned by other third parties and are used and distributed under license. Some parts of this software are covered under the GNU Public License. A copy of the license is available at http://www.gnu.org/licenses/gpl.html. switch(standby)#
كما تمت مناقشته مسبقا، عند إدخال خدمة sup الاحتياطية في النظام، يتم نسخ تكوين وحالة جميع مكونات المشرف النشط إلى وضع الاستعداد (gsync). إلى أن تكتمل هذه العملية، لا يعتبر المشرف النشط وجود مشرف في وضع الاستعداد. للتحقق من اكتمال هذه العملية، يمكنك إصدار الأمر التالي على المشرف النشط. يشير إخراج الأمر إلى أن المزامنة قيد التقدم (وربما لا يتم إتمامها أبدا).
switch# show system redundancy status Redundancy mode --------------- administrative: HA operational: None This supervisor (sup-1) ----------------------- Redundancy state: Active Supervisor state: Active Internal state: Active with HA standby Other supervisor (sup-2) ------------------------ Redundancy state: Standby Supervisor state: HA standby Internal state: HA synchronization in progress
السبب الأكثر إحتمالا لحدوث ذلك هو إذا فشل أحد مكونات البرامج الموجودة في وضع الاستعداد في مزامنة حالته مع المشرف النشط. للتحقق من العمليات التي لم تتم مزامنتها، يمكنك إصدار هذا الأمر على المشرف النشط، كما يشير الإخراج إلى أن الكثير من مكونات البرامج لم تكتمل المزامنة.
switch# show system internal sysmgr gsyncstats Name Gsync done Gsync time(sec) ---------------- ---------- ------------- aaa 1 0 ExceptionLog 1 0 platform 1 1 radius 1 0 securityd 1 0 SystemHealth 1 0 tacacs 0 N/A acl 1 0 ascii-cfg 1 1 bios_daemon 0 N/A bootvar 1 0 callhome 1 0 capability 1 0 cdp 1 0 cfs 1 0 cimserver 1 0 cimxmlserver 0 N/A confcheck 1 0 core-dmon 1 0 core-client 0 N/A device-alias 1 0 dpvm 0 N/A dstats 1 0 epld_upgrade 0 N/A epp 1 1
بالإضافة إلى ذلك، عند النظر إلى المشرف في وضع الاستعداد، نلاحظ أن مكون برنامج Xbar قد تمت إعادة تشغيله 23 مرة. يبدو هذا السبب الأكثر ترجيحا لعدم ظهور الاستعداد.
switch(standby)# show system internal sysmgr service all Name UUID PID SAP state Start count ---------------- ---------- ------ ----- ----- ----------- aaa 0x000000B5 1458 111 s0009 1 ExceptionLog 0x00000050 [NA] [NA] s0002 None platform 0x00000018 1064 39 s0009 1 radius 0x000000B7 1457 113 s0009 1 securityd 0x0000002A 1456 55 s0009 1 vsan 0x00000029 1436 15 s0009 1 vshd 0x00000028 1408 37 s0009 1 wwn 0x00000030 1435 114 s0009 1 xbar 0x00000017 [NA] [NA] s0017 23 xbar_client 0x00000049 1434 917 s0009 1
المثال 3: خدمة Standby Sup في حالة التشغيل
في هذا المثال، يتم إدخال بروتوكول الشجرة المتفرعة (SUP) في الفتحة 6. يظهر الأمر show module الذي تم إصداره على بروتوكول الشجرة المتفرعة (SUP) في وضع الاستعداد في حالة تشغيل فوق.
switch# show module Mod Ports Module-Type Model Status --- ----- -------------------------------- ------------------ ------------ 5 0 Supervisor/Fabric-1 DS-X9530-SF1-K9 active * 6 0 Supervisor/Fabric-1 powered-up 8 8 IP Storage Services Module powered-dn Mod Sw Hw World-Wide-Name(s) (WWN) --- ----------- ------ -------------------------------------------------- 5 2.1(2) 1.1 -- Mod MAC-Address(es) Serial-Num --- -------------------------------------- ---------- 5 00-0b-be-f7-4d-1c to 00-0b-be-f7-4d-20 JAB070307XG
في هذا المثال، لا يعطي show logging أي معلومات قيمة ولا يعرض سجل الاستثناءات الداخلي للوحدة النمطية. ومع ذلك، فإنه نظرا لأن جميع الانتقالات في الحالة لوحدة نمطية معينة يتم تخزينها في مدير الوحدة النمطية، فإنه يمكننا النظر إلى حالات نقل مدير الوحدة النمطية لمعرفة ما هو الخطأ. الحالات الداخلية هي:
Switch# show module internal event-history module 5 64) FSM:<ID(1): Slot 6, node 0x0601> Transition at 563504 usecs after Wed Sep 28 14:44:53 2005 Previous state: [LCM_ST_LC_NOT_PRESENT] Triggered event: [LCM_EV_PFM_MODULE_SUP_INSERTED] Next state: [LCM_ST_SUPERVISOR_INSERTED] 65) FSM:<ID(1): Slot 6, node 0x0601> Transition at 563944 usecs after Wed Sep 28 14:44:53 2005 Previous state: [LCM_ST_SUPERVISOR_INSERTED] Triggered event: [LCM_EV_START_SUP_INSERTED_SEQUENCE] Next state: [LCM_ST_CHECK_INSERT_SEQUENCE] 66) Event:ESQ_START length:32, at 564045 usecs after Wed Sep 28 14:44:53 2005 Instance:1, Seq Id:0x2710, Ret:success Seq Type:SERIAL 67) Event:ESQ_REQ length:32, at 564422 usecs after Wed Sep 28 14:44:53 2005 Instance:1, Seq Id:0x1, Ret:success [E_MTS_TX] Dst:MTS_SAP_MIGUTILS_DAEMON(949), Opc:MTS_OPC_LC_INSERTED(1081) 68) Event:ESQ_RSP length:32, at 566174 usecs after Wed Sep 28 14:44:53 2005 Instance:1, Seq Id:0x1, Ret:success [E_MTS_RX] Src:MTS_SAP_MIGUTILS_DAEMON(949), Opc:MTS_OPC_LC_INSERTED(1081) 69) Event:ESQ_REQ length:32, at 566346 usecs after Wed Sep 28 14:44:53 2005 Instance:1, Seq Id:0x2, Ret:success [E_MTS_TX] Dst:MTS_SAP_NTP(72), Opc:MTS_OPC_LC_INSERTED(1081) 70) Event:ESQ_RSP length:32, at 566635 usecs after Wed Sep 28 14:44:53 2005 Instance:1, Seq Id:0x2, Ret:success [E_MTS_RX] Src:MTS_SAP_NTP(72), Opc:MTS_OPC_LC_INSERTED(1081) 71) Event:ESQ_REQ length:32, at 566772 usecs after Wed Sep 28 14:44:53 2005 Instance:1, Seq Id:0x3, Ret:success [E_MTS_TX] Dst:MTS_SAP_XBAR_MANAGER(48), Opc:MTS_OPC_LC_INSERTED(1081) 73) Event:ESQ_RSP length:32, at 586418 usecs after Wed Sep 28 14:44:53 2005 Instance:1, Seq Id:0x3, Ret:(null) [E_MTS_RX] Src:MTS_SAP_XBAR_MANAGER(48), Opc:MTS_OPC_LC_INSERTED(1081) 74) FSM:<ID(1): Slot 6, node 0x0601> Transition at 586436 usecs after Wed Sep 28 14:44:53 2005 Previous state: [LCM_ST_CHECK_INSERT_SEQUENCE] Triggered event: [LCM_EV_LC_INSERTED_SEQ_FAILED] Next state: [LCM_ST_CHECK_REMOVAL_SEQUENCE] 75) Event:ESQ_START length:32, at 586611 usecs after Wed Sep 28 14:44:53 2005 Instance:1, Seq Id:0x2710, Ret:success Seq Type:SERIAL 76) Event:ESQ_REQ length:32, at 593649 usecs after Wed Sep 28 14:44:53 2005 Instance:1, Seq Id:0x1, Ret:success [E_MTS_TX] Dst:MTS_SAP_MIGUTILS_DAEMON(949), Opc:MTS_OPC_LC_REMOVED(1082) 77) Event:ESQ_RSP length:32, at 594854 usecs after Wed Sep 28 14:44:53 2005 Instance:1, Seq Id:0x1, Ret:success [E_MTS_RX] Src:MTS_SAP_MIGUTILS_DAEMON(949), Opc:MTS_OPC_LC_REMOVED(1082) 90) FSM:<ID(1): Slot 6, node 0x0601> Transition at 604447 usecs after Wed Sep 28 14:44:53 2005 Previous state: [LCM_ST_CHECK_REMOVAL_SEQUENCE] Triggered event: [LCM_EV_ALL_LC_REMOVED_RESP_RECEIVED] Next state: [LCM_ST_LC_FAILURE] 91) FSM:<ID(1): Slot 6, node 0x0601> Transition at 604501 usecs after Wed Sep 28 14:44:53 2005 Previous state: [LCM_ST_LC_FAILURE] Triggered event: [LCM_EV_LC_INSERTED_SEQ_FAILED] Next state: [LCM_ST_LC_FAILURE] 92) FSM:<ID(1): Slot 6, node 0x0601> Transition at 604518 usecs after Wed Sep 28 14:44:53 2005 Previous state: [LCM_ST_LC_FAILURE] Triggered event: [LCM_EV_SUPERVISOR_FAILURE] Next state: [LCM_ST_LC_NOT_PRESENT] Curr state: [LCM_ST_LC_NOT_PRESENT] switch#
راجع السجلات الموجودة أعلى الفهرس 92، يشير إلى أن المشرف في حالة فشل والحدث المشغل هو LCM_EV_LC_INSERT_SEQ_FAILED. (فشل تسلسل الإدخال). الانتقال لأعلى السجلات لمعرفة سبب فشل تسلسل الإدراج، راجع فشل تسلسل الإدراج مباشرة بعد إستجابة من MTS_SAP_XBAR_MANAGER (الفهرس 73 والفهرس 74). يشير ذلك إلى وجود خطأ ما في تكوين Xbar عند إدراج موفر خدمة الاستعداد. يمكن تنفيذ المزيد من تصحيح الأخطاء من خلال النظر في السجلات الداخلية للمكون الفاشل (في هذه الحالة، مكون xbar).