تسعى مجموعة الوثائق لهذا المنتج جاهدة لاستخدام لغة خالية من التحيز. لأغراض مجموعة الوثائق هذه، يتم تعريف "خالية من التحيز" على أنها لغة لا تعني التمييز على أساس العمر، والإعاقة، والجنس، والهوية العرقية، والهوية الإثنية، والتوجه الجنسي، والحالة الاجتماعية والاقتصادية، والتمييز متعدد الجوانب. قد تكون الاستثناءات موجودة في الوثائق بسبب اللغة التي يتم تشفيرها بشكل ثابت في واجهات المستخدم الخاصة ببرنامج المنتج، أو اللغة المستخدمة بناءً على وثائق RFP، أو اللغة التي يستخدمها منتج الجهة الخارجية المُشار إليه. تعرّف على المزيد حول كيفية استخدام Cisco للغة الشاملة.
ترجمت Cisco هذا المستند باستخدام مجموعة من التقنيات الآلية والبشرية لتقديم محتوى دعم للمستخدمين في جميع أنحاء العالم بلغتهم الخاصة. يُرجى ملاحظة أن أفضل ترجمة آلية لن تكون دقيقة كما هو الحال مع الترجمة الاحترافية التي يقدمها مترجم محترف. تخلي Cisco Systems مسئوليتها عن دقة هذه الترجمات وتُوصي بالرجوع دائمًا إلى المستند الإنجليزي الأصلي (الرابط متوفر).
يصف هذا المستند رسائل فشل مسار بيانات البنية المضمنة التي تمت رؤيتها أثناء عملية سلسلة موجه خدمات التجميع (ASR) 9000 من Cisco.
تظهر الرسالة بهذا التنسيق:
RP/0/RSP0/CPU0:Sep 3 13:49:36.595 UTC: pfm_node_rp[358]:
%PLATFORM-DIAGS-3-PUNT_FABRIC_DATA_PATH_FAILED: Set|online_diag_rsp[241782]|
System Punt/Fabric/data Path Test(0x2000004)|failure threshold is 3, (slot, NP)
failed: (0/7/CPU0, 1) (0/7/CPU0, 2) (0/7/CPU0, 3) (0/7/CPU0, 4) (0/7/CPU0, 5)
(0/7/CPU0, 6) (0/7/CPU0, 7)
هذا وثيقة مقصود ل أي شخص يريد أن يفهم الخطأ رسالة، والإجراءات أن يأخذ إن يرى المشكلة.
توصي Cisco بأن تكون لديك معرفة عالية المستوى بالمواضيع التالية:
على أي حال، لا يتطلب هذا المستند من القراء أن يكونوا على دراية بتفاصيل الأجهزة. يتم توفير معلومات الخلفية الضرورية قبل شرح رسالة الخطأ. تصف هذه الوثيقة الخطأ في كل من بطاقات خطوط Trident-and Typhoon. راجع فهم أنواع بطاقات الخط ASR 9000 Series للحصول على شرح لهذه المصطلحات.
لا يقتصر هذا المستند على إصدارات برامج ومكونات مادية معينة.
تم إنشاء المعلومات الواردة في هذا المستند من الأجهزة الموجودة في بيئة معملية خاصة. بدأت جميع الأجهزة المُستخدمة في هذا المستند بتكوين ممسوح (افتراضي). إذا كانت شبكتك قيد التشغيل، فتأكد من فهمك للتأثير المحتمل لأي أمر.
فكر في هذه الاقتراحات حول كيفية إستخدام هذا المستند للحصول على التفاصيل الأساسية وكدليل مرجعي في عملية أستكشاف الأخطاء وإصلاحها:
يمكن أن تجتاز الحزمة إما نقطتين أو ثلاث نقلات من خلال بنية المحول استنادا إلى نوع بطاقة الخط. تضيف بطاقات خط توليد الإعصار عنصرا إضافيا من بنية المحول، بينما تعمل بطاقات الخط المستندة إلى Trident على تحويل حركة المرور بالكامل باستخدام البنية الموجودة على بطاقة معالج التوجيه فقط. توضح هذه المخططات عناصر البنية لكل من أنواع بطاقات الخط هذه، بالإضافة إلى اتصال البنية ببطاقة معالج التوجيه:
يقوم التطبيق التشخيصي الذي يتم تشغيله على وحدة المعالجة المركزية لبطاقة معالج المسار بضم الحزم التشخيصية الموجهة إلى كل معالج شبكة (NP) بشكل دوري. يتم تكرار الحزمة التشخيصية مرة أخرى داخل NP، ويتم إعادتها نحو وحدة المعالجة المركزية لبطاقة معالج التوجيه التي استعانت بالحزمة. يوفر هذا الفحص الدوري للصحة لكل NP مع حزمة فريدة لكل NP بواسطة التطبيق التشخيصي على بطاقة معالج المسار تنبيها لأية أخطاء وظيفية على مسار البيانات أثناء تشغيل الموجه. من الضروري ملاحظة أن التطبيق التشخيصي على كل من معالج التوجيه النشط ومعالج المسار الاحتياطي يقوم بتنزيل حزمة واحدة لكل NP بشكل دوري والاحتفاظ بعدد نجاح أو فشل لكل NP. عند الوصول إلى عتبة الحزم التشخيصية الملغاة، يثير التطبيق خطأ.
قبل أن يصف المستند مسار التشخيص على بطاقات الخط المستندة إلى Trident و Typhoon، يوفر هذا القسم مخطط عام لمسار تشخيص البنية من بطاقات معالج المسار النشطة والاحتياطية إلى NP على بطاقة الخط.
يتم التعامل مع الحزم التشخيصية التي يتم حقنها من معالج التوجيه النشط في البنية نحو NP على أنها حزم للبث الأحادي بواسطة بنية المحول. باستخدام حزم البث الأحادي، تختار بنية المحول الارتباط الصادر استنادا إلى حمل حركة المرور الحالي للارتباط، والذي يساعد على إخضاع الحزم التشخيصية لتحميل حركة مرور البيانات على الموجه. عندما يكون هناك يتعدد خطوة خارج باتجاه NP، المفتاح بناء ASIC يختار خطوة أن يكون حاليا الأقل تحميل.
يصف هذا الرسم التخطيطي مسار الحزمة التشخيصية المستمدة من معالج المسار النشط.
ملاحظة: يتم إختيار الارتباط الأول الذي يربط بين ASIC لواجهة البنية (FIA) على بطاقة الخط و Crossbar (XBAR) على بطاقة معالج التوجيه طوال الوقت للحزم الموجهة إلى NP. تخضع حزم الاستجابة من بروتوكول الشبكة (NP) لخوارزمية توزيع تحميل الارتباط (إذا كانت بطاقة الخط تستند إلى إعصار). وهذا يعني أن حزمة الاستجابة من NP نحو معالج التوجيه النشط يمكن أن تختار أي من روابط البنية التي تربط بطاقات الخط ببطاقة معالج التوجيه استنادا إلى حمل إرتباط البنية.
يتم التعامل مع الحزم التشخيصية التي يتم حقنها من معالج التوجيه الاحتياطي في البنية نحو بروتوكول الشبكة (NP) كحزم بث متعدد بواسطة بنية المحول. على الرغم من أنها حزمة بث متعدد، إلا أنه لا يوجد تكرار داخل البنية. لا تزال كل حزمة تشخيص يتم الحصول عليها من معالج المسار الاحتياطي تصل إلى بروتوكول NP واحد فقط في كل مرة. كما أن حزمة الاستجابة من NP تجاه معالج التوجيه هي حزمة بث متعدد عبر البنية دون نسخ مماثل. وبالتالي، يستلم التطبيق التشخيصي على معالج التوجيه الاحتياطي حزمة إستجابة واحدة من NPs، بواقع حزمة واحدة في كل مرة. يتتبع التطبيق التشخيصي كل NP في النظام، لأنه يتضمن حزمة واحدة لكل NP، ويتوقع استجابات من كل NP، حزمة واحدة في كل مرة. باستخدام حزمة بث متعدد، تختار بنية المحول الارتباط الصادر استنادا إلى قيمة حقل في رأس الحزمة، مما يساعد في إدخال الحزم التشخيصية عبر كل إرتباط بناء بين بطاقة معالج التوجيه وبطاقة الخط. يتتبع معالج التوجيه الاحتياطي حماية NP عبر كل إرتباط بنيوي يتصل بين بطاقة معالج التوجيه وفتحة بطاقة الخط.
يصف المخطط السابق مسار الحزمة التشخيصية المصد من معالج المسار الاحتياطي. لاحظ أنه، وعلى عكس حالة معالج المسار النشط، تتم ممارسة جميع الارتباطات التي تربط بطاقة الخط ب XBAR على معالج التوجيه. تأخذ حزم الاستجابة من NP نفس إرتباط البنية الذي تم إستخدامه من قبل الحزمة في توجيه المعالج إلى إتجاه بطاقة الخط. يضمن هذا الاختبار مراقبة جميع الارتباطات التي توصل معالج التوجيه الاحتياطي ببطاقة الخط بشكل مستمر.
يصف هذا الرسم التخطيطي الحزم التشخيصية المستمدة من معالج التوجيه الموجهة إلى NP التي يتم إرجاعها إلى معالج التوجيه. من المهم ملاحظة روابط مسارات البيانات و ASICs المشتركة بين جميع شبكات NP، بالإضافة إلى الارتباطات والمكونات الخاصة بمجموعة فرعية من شبكات NP. على سبيل المثال، إن Bridge ASIC 0 (B0) شائع مع NP0 و NP1، بينما FIA0 مشترك بين جميع NPs. في نهاية معالج التوجيه، تكون جميع الارتباطات وقواعد ASIC الخاصة بمسار البيانات وصفيف البوابة القابل للبرمجة في الميدان (FPGA) مشتركة بين جميع بطاقات الخط، وبالتالي لجميع بطاقات NP في الهيكل.
يصف هذا الرسم التخطيطي الحزم التشخيصية المستمدة من بطاقة معالج التوجيه الموجهة إلى NP التي يتم إرجاعها إلى معالج التوجيه. من المهم ملاحظة إرتباطات مسارات البيانات و ASICs المشتركة بين جميع نقاط الوصول إلى الشبكة (NPs) وكذلك الارتباطات والمكونات الخاصة بمجموعة فرعية من نقاط الوصول إلى الشبكة (NPs). على سبيل المثال، FIA0 شائع مع NP0 و NP1. في نهاية بطاقة معالج التوجيه، تكون جميع الارتباطات وبيئات ASIC الخاصة بمسار البيانات و FGPA مشتركة لجميع بطاقات الخط، وبالتالي لجميع بطاقات NP في الهيكل.
في بطاقات خط توماهوك هناك اتصال 1:1 بين FIA و NP.
على بطاقات الخط Lightspeed و LightspeedPlus، يتم دمج FIA في شريحة NP.
تحاول الأقسام القليلة التالية وصف مسار الحزمة لكل NP. هذا ضروري in order to فهمت ال punt بناء معطيات مسار خطأ رسالة، وأيضا in order to حددت الفشل نقطة.
يؤدي الفشل في الحصول على استجابات من بروتوكول الشبكة (NP) في موجه قائم على ASR 9000 إلى ظهور تنبيه. يحدث القرار برفع تنبيه بواسطة تطبيق التشخيص عبر الإنترنت الذي يتم تنفيذه على معالج المسار عندما تكون هناك ثلاث حالات فشل متتالية. يحتفظ التطبيق التشخيصي بنافذة فشل ثلاث حزم لكل NP. يتم تشخيص معالج المسار النشط ومعالج المسار الاحتياطي بشكل مستقل وبالتوازي. يمكن أن يقوم معالج التوجيه النشط أو معالج المسار الاحتياطي أو كلا بطاقتي معالج المسار بالإبلاغ عن الخطأ. يحدد موقع الخطأ وفقدان الحزمة أي معالج توجيه يقوم بإرسال الإنذار.
التكرار الافتراضي للحزمة التشخيصية تجاه كل NP هو حزمة واحدة لكل 60 ثانية أو حزمة واحدة في الدقيقة.
هذا هو تنسيق رسالة التنبيه:
RP/0/RSP0/CPU0:Sep 3 13:49:36.595 UTC: pfm_node_rp[358]:
%PLATFORM-DIAGS-3-PUNT_FABRIC_DATA_PATH_FAILED: Set|online_diag_rsp[241782]|
System Punt/Fabric/data Path Test(0x2000004)|failure threshold is 3, (slot, NP)
failed: (0/7/CPU0, 1) (0/7/CPU0, 2) (0/7/CPU0, 3) (0/7/CPU0, 4) (0/7/CPU0, 5)
(0/7/CPU0, 6) (0/7/CPU0, 7)
تظهر الرسالة فشل في الوصول إلى NP 1، 2، 3، 4، 5، 6، و 7 على بطاقة الخط 0/7/cpu0 من معالج التوجيه 0/rsp0/cpu0.
من قائمة الاختبارات التشخيصية عبر الإنترنت، يمكنك رؤية سمات إختبار الاسترجاع الخاص بالقناة الليفية باستخدام هذا الأمر:
RP/0/RSP0/CPU0:iox(admin)#show diagnostic content location 0/RSP0/CPU0
RP 0/RSP0/CPU0:
Diagnostics test suite attributes:
M/C/* - Minimal bootup level test / Complete bootup level test / NA
B/O/* - Basic ondemand test / not Ondemand test / NA
P/V/* - Per port test / Per device test / NA
D/N/* - Disruptive test / Non-disruptive test / NA
S/* - Only applicable to standby unit / NA
X/* - Not a health monitoring test / NA
F/* - Fixed monitoring interval test / NA
E/* - Always enabled monitoring test / NA
A/I - Monitoring is active / Monitoring is inactive
Test Interval Thre-
ID Test Name Attributes (day hh:mm:ss.ms shold)
==== ================================== ============ ================= =====
1) PuntFPGAScratchRegister ---------- *B*N****A 000 00:01:00.000 1
2) FIAScratchRegister --------------- *B*N****A 000 00:01:00.000 1
3) ClkCtrlScratchRegister ----------- *B*N****A 000 00:01:00.000 1
4) IntCtrlScratchRegister ----------- *B*N****A 000 00:01:00.000 1
5) CPUCtrlScratchRegister ----------- *B*N****A 000 00:01:00.000 1
6) FabSwitchIdRegister -------------- *B*N****A 000 00:01:00.000 1
7) EccSbeTest ----------------------- *B*N****I 000 00:01:00.000 3
8) SrspStandbyEobcHeartbeat --------- *B*NS***A 000 00:00:05.000 3
9) SrspActiveEobcHeartbeat ---------- *B*NS***A 000 00:00:05.000 3
10) FabricLoopback ------------------- MB*N****A 000 00:01:00.000 3
11) PuntFabricDataPath --------------- *B*N****A 000 00:01:00.000 3
12) FPDimageVerify ------------------- *B*N****I 001 00:00:00.000 1
RP/0/RSP0/CPU0:ios(admin)#
يوضح الإخراج أن تردد إختبار PuntFabricDataPath هو حزمة واحدة كل دقيقة، وعتبة الفشل هي ثلاث حزم، مما يعني أنه لا يتم السماح بفقدان ثلاث حزم متتالية مما ينتج عنه إنذار. سمات الاختبار المعروضة هي قيم افتراضية. لتغيير الافتراضيات، أدخل diagnostic monitor interval
و diagnostic monitor threshold
في وضع تكوين الإدارة.
مسار تشخيص البنية
يصف هذا المخطط مسار الحزمة بين وحدة المعالجة المركزية لمعالج التوجيه وبطاقة الخط NP0. الرابط الذي يربط B0 و NP0 هو الرابط الوحيد الخاص ب NP0. كل الروابط الأخرى تقع في المسار المشترك.
دون مسار الحزمة من معالج التوجيه إلى NP0. على الرغم من وجود أربعة إرتباطات لاستخدامها للحزم الموجهة نحو NP0 من معالج التوجيه، إلا أن أول إرتباط بين معالج التوجيه وفتحة بطاقة الخط يستخدم للحزمة من معالج التوجيه إلى بطاقة الخط. يمكن إرسال الحزمة المرتجعة من NP0 مرة أخرى إلى معالج التوجيه النشط عبر أي من مساري إرتباط البنية بين فتحة بطاقة الخط ومعالج المسار النشط. يعتمد إختيار أحد الربطين اللذين سيتم إستخدامهما على حمل الارتباط في ذلك الوقت. تستخدم حزمة الاستجابة من NP0 نحو معالج المسار الاحتياطي كلا الرابطين، ولكن إرتباطا واحدا في كل مرة. يعتمد إختيار الارتباط على حقل الرأس الذي يقوم التطبيق التشخيصي بملئه.
سيناريو الصدع الفردي
إذا تم اكتشاف Single Platform Fault Manager (PFM) Punt Fabric Data Failure Alarm مع وجود NP0 فقط في رسالة الفشل، فإن الخطأ يكون فقط على مسار البنية الذي يربط معالج التوجيه وبطاقة الخط NP0. هذا خطأ وحيد. إذا تم الكشف عن الخطأ لأكثر من NP واحد، فارجع إلى قسم سيناريو الأخطاء المتعددة.
RP/0/RSP0/CPU0:Sep 3 13:49:36.595 UTC: pfm_node_rp[358]:
%PLATFORM-DIAGS-3-PUNT_FABRIC_DATA_PATH_FAILED: Set|online_diag_rsp[241782]|
System Punt/Fabric/data Path Test(0x2000004)|failure threshold is 3, (slot, NP)
failed: (0/7/CPU0, 0)
ملاحظة: ينطبق هذا القسم من المستند على أي فتحة بطاقة خط في الهيكل، بغض النظر عن نوع الهيكل. وبالتالي، يمكن تطبيق هذا على جميع فتحات بطاقات الخط.
وكما هو موضح في الرسم التخطيطي السابق لمسار البيانات، يجب أن يكون الخطأ في موقع واحد أو أكثر من هذه المواقع:
سيناريو الأخطاء المتعددة
أخطاء NP متعددة
عندما يتم ملاحظة أخطاء أخرى على NP0 أو يتم الإبلاغ عن الخطأ PUNT_FABRIC_DATA_PATH_FAILED أيضا من قبل شبكات NP الأخرى على بطاقة الخط نفسها، ثم يتم عزل الأعطال من خلال ربط جميع الأخطاء. على سبيل المثال، إذا حدث كل من خطأ PUNT_FABRIC_DATA_PATH_FAILED و LC_NP_LOOPBACK_FAILED على NP0، فإن NP يكون قد توقف عن معالجة الحزم. أحلت ال np أنشوطة تشخيصي ممر قسم in order to فهمت ال loopback خطأ. قد يكون ذلك مؤشرا مبكرا على فشل خطير داخل NP0. ومع ذلك، في حالة حدوث خطأ واحد فقط من العيب، تتم ترجمة الخطأ إما إلى مسار بيانات بنية Punt أو على وحدة المعالجة المركزية (CPU) لبطاقة الخط إلى مسار NP.
إن يتلقى أكثر من واحد NP على خط خطأ nt بناء معطيات ممر، بعد ذلك أنت ينبغي ذهبت فوق الشجرة ممر من بناء خطوة in order to عزلت مكون خطأ. مثلا، إن على حد سواء NP0 و NP1 خطأ، بعد ذلك الخطأ ينبغي أن يكون في B0 أو الرابط أن يربط B0 و FIA0. ومن غير المحتمل أن تواجه كلا من NP0 و NP1 خطأ داخليا فادحا في نفس الوقت. على الرغم من قلة أحتمالية حدوث ذلك، من الممكن أن تواجه NP0 و NP1 خطأ فادحا بسبب المعالجة غير الصحيحة لنوع معين من الحزم أو حزمة غير صحيحة.
تبلغ كل من بطاقتي معالج التوجيه عن وجود خطأ
إذا أبلغت كل من بطاقات معالج المسار النشطة والاحتياطية عن خطأ في واحدة أو أكثر من بطاقات واجهة الشبكة (NP) على بطاقة خط، فتحقق من جميع الارتباطات والمكونات الشائعة على مسار البيانات بين بطاقات واجهة الشبكة (NP) المتأثرة وكل من بطاقات معالج التوجيه.
يصف هذا المخطط مسار الحزمة بين وحدة المعالجة المركزية لبطاقة معالج التوجيه و NP1 لبطاقة الخط. الرابط أن يربط جسر ASIC 0 (B0) و NP1 هو الرابط الوحيد الخاص ب NP1. كل الروابط الأخرى تقع في المسار المشترك.
دون مسار الحزمة من بطاقة معالج التوجيه إلى NP1. على الرغم من وجود أربعة إرتباطات لاستخدامها للحزم الموجهة نحو NP0 من معالج التوجيه، إلا أن أول إرتباط بين معالج التوجيه وفتحة بطاقة الخط يستخدم للحزمة من معالج التوجيه إلى بطاقة الخط. يمكن إرسال الحزمة التي تم إرجاعها من NP1 إلى معالج التوجيه النشط عبر أي من مساري إرتباط البنية بين فتحة بطاقة الخط ومعالج التوجيه النشط. يعتمد إختيار أحد الربطين اللذين سيتم إستخدامهما على حمل الارتباط في ذلك الوقت. تستخدم حزمة الاستجابة من NP1 نحو معالج المسار الاحتياطي كلا الرابطين، ولكن إرتباطا واحدا في كل مرة. يعتمد إختيار الارتباط على حقل الرأس الذي يقوم التطبيق التشخيصي بملئه.
مسار تشخيص البنية
أحلت ال NP0 تشخيص إخفاق قسم، غير أن يطبق ال نفسه سبب ل NP1 (بدلا من NP0).
يصف هذا المخطط مسار الحزمة بين وحدة المعالجة المركزية لبطاقة معالج التوجيه و NP2 لبطاقة الخط. الرابط الذي يربط B1 و NP2 هو الرابط الوحيد الخاص ب NP2. كل الروابط الأخرى تقع في المسار المشترك.
دون مسار الحزمة من بطاقة معالج التوجيه إلى NP2. وعلى الرغم من وجود أربعة إرتباطات لاستخدامها للحزم الموجهة نحو NP2 من معالج التوجيه، إلا أن الارتباط الأول بين معالج التوجيه وفتحة بطاقة الخط يستخدم للحزمة من معالج التوجيه إلى بطاقة الخط. يمكن إرسال الحزمة التي تم إرجاعها من NP2 إلى معالج التوجيه النشط عبر أي من مساري إرتباط البنية بين فتحة بطاقة الخط ومعالج التوجيه النشط. يعتمد إختيار أحد الربطين اللذين سيتم إستخدامهما على حمل الارتباط في ذلك الوقت. تستخدم حزمة الاستجابة من NP2 نحو معالج التوجيه الاحتياطي كلا الرابطين، ولكن إرتباطا واحدا في كل مرة. يعتمد إختيار الارتباط على حقل الرأس الذي يقوم التطبيق التشخيصي بملئه.
مسار تشخيص البنية
أحلت ال NP0 تشخيص إخفاق قسم، غير أن يطبق ال نفسه سبب ل NP2 (بدلا من NP0).
يصف هذا المخطط مسار الحزمة بين وحدة المعالجة المركزية لبطاقة معالج التوجيه و NP3 لبطاقة الخط. الرابط أن يربط جسر ASIC 1 (B1) و NP3 هو الرابط الوحيد الخاص ب NP3. كل الروابط الأخرى تقع في المسار المشترك.
دون مسار الحزمة من بطاقة معالج التوجيه إلى NP3. وعلى الرغم من وجود أربعة إرتباطات لاستخدامها للحزم الموجهة نحو NP3 من معالج التوجيه، إلا أن الارتباط الأول بين معالج التوجيه وفتحة بطاقة الخط يستخدم للحزمة من معالج التوجيه إلى بطاقة الخط. يمكن إرسال الحزمة المرتجعة من NP3 مرة أخرى إلى معالج التوجيه النشط عبر أي من مساري إرتباط البنية بين فتحة بطاقة الخط ومعالج التوجيه النشط. يعتمد إختيار أحد الربطين اللذين سيتم إستخدامهما على حمل الارتباط في ذلك الوقت. تستخدم حزمة الاستجابة من NP3 نحو معالج المسار الاحتياطي كلا الرابطين، ولكن إرتباطا واحدا في كل مرة. يعتمد إختيار الارتباط على حقل الرأس الذي يقوم التطبيق التشخيصي بملئه.
مسار تشخيص البنية
أحلت ال NP0 تشخيص إخفاق قسم، غير أن يطبق ال نفسه سبب ل NP3 (بدلا من NP0).
يقدم هذا القسم مثالين من أجل تحديد الخلفية لحزم إختبار البنية باستخدام بطاقات خطوط مستندة إلى الإعصار. يستخدم المثال الأول بروتوكول NP1، أما المثال الثاني فيستخدم بروتوكول NP3. ويمكن توسيع نطاق الوصف والتحليل ليشمل غيرها من البرامج الوطنية في أي بطاقة خط مستندة إلى إعصار.
يصف المخطط التالي مسار الحزمة بين وحدة المعالجة المركزية لبطاقة معالج التوجيه و NP1 لبطاقة الخط. الارتباط الذي يربط FIA0 و NP1 هو الارتباط الوحيد المحدد لمسار NP1. تقع جميع الارتباطات الأخرى بين فتحة بطاقة الخط وفتحة بطاقة معالج التوجيه في المسار الشائع. إن الارتباطات التي تربط XBAR ASIC الخاص بالقناة الليفية على بطاقة الخط مع FIAs على بطاقة الخط خاصة بمجموعة فرعية من NPs. على سبيل المثال، يتم إستخدام كلا الروابط بين FIA0 و XBAR ASIC المحلي عبر بطاقة الخط لحركة المرور إلى NP1.
دون مسار الحزمة من بطاقة معالج التوجيه إلى NP1. على الرغم من وجود ثمانية إرتباطات لاستخدامها للحزم الموجهة نحو NP1 من بطاقة معالج التوجيه، إلا أنه يتم إستخدام مسار واحد بين بطاقة معالج التوجيه وفتحة بطاقة الخط. يمكن إعادة إرسال الحزمة المرتجعة من NP1 إلى بطاقة معالج التوجيه عبر ثمانية مسارات إرتباط بنى بين فتحة بطاقة الخط ومعالج التوجيه. يتم ممارسة كل من هذه الارتباطات الثمانية واحدة في كل مرة يتم فيها توجيه الحزمة التشخيصية مرة أخرى إلى وحدة المعالجة المركزية لبطاقة معالج التوجيه.
مسار تشخيص البنية
يصف هذا المخطط مسار الحزمة بين وحدة المعالجة المركزية لبطاقة معالج التوجيه و NP3 لبطاقة الخط. الرابط الذي يربط FIA1 و NP3 هو الرابط الوحيد الخاص بمسار NP3. تقع جميع الارتباطات الأخرى بين فتحة بطاقة الخط وفتحة بطاقة معالج التوجيه في المسار الشائع. إن الارتباطات التي تربط XBAR ASIC الخاص بالقناة الليفية على بطاقة الخط مع FIAs على بطاقة الخط خاصة بمجموعة فرعية من NPs. على سبيل المثال، يتم إستخدام كلا الروابط بين FIA1 والنسيج المحلي XBAR ASIC على بطاقة الخط لحركة المرور إلى NP3.
دون مسار الحزمة من بطاقة معالج التوجيه إلى NP3. على الرغم من وجود ثمانية إرتباطات لاستخدامها للحزم الموجهة نحو NP3 من بطاقة معالج التوجيه، إلا أنه يتم إستخدام مسار واحد بين بطاقة معالج التوجيه وفتحة بطاقة الخط. يمكن إعادة إرسال الحزمة المرتجعة من NP1 إلى بطاقة معالج التوجيه عبر ثمانية مسارات إرتباط بنى بين فتحة بطاقة الخط ومعالج التوجيه. يتم ممارسة كل من هذه الارتباطات الثمانية واحدة في كل مرة يتم فيها توجيه الحزمة التشخيصية مرة أخرى إلى وحدة المعالجة المركزية لبطاقة معالج التوجيه.
مسار تشخيص البنية
نظرا لاتصال 1:1 بين FIA و NP، فإن حركة المرور الوحيدة التي تجتاز FIA0 هي إلى/من NP0.
ونظرا لأن FIA مدمجة في رقاقة NP، فإن حركة المرور الوحيدة التي تجتاز FIA0 هي إلى/من NP0.
يقوم هذا القسم بتصنيف الأخطاء إلى حالات صعبة وعابرة، ويسرد الخطوات المستخدمة لتحديد ما إذا كان الخطأ خطأ فادحا أو عابرا. بمجرد تحديد نوع الخطأ، يحدد المستند الأوامر التي يمكن تنفيذها على الموجه لفهم الخطأ وما هي الإجراءات التصحيحية التي يلزم إتخاذها.
إذا تم اتباع رسالة PFM مجموعة برسالة PFM واضحة، فهذا يعني حدوث خطأ، ويقوم الموجه بتصحيح الخطأ نفسه. قد تحدث أعطال مؤقتة بسبب الظروف البيئية والأعطال القابلة للاسترداد في مكونات الأجهزة. قد يكون من الصعب في بعض الأحيان ربط الأخطاء العابرة بأي حدث معين.
فيما يلي مثال على أعطال البنية العابرة للتوضيح:
RP/0/RSP0/CPU0:Feb 5 05:05:44.051 : pfm_node_rp[354]:
%PLATFORM-DIAGS-3-PUNT_FABRIC_DATA_PATH_FAILED : Set|online_diag_rsp[237686]|
System Punt/Fabric/data Path Test(0x2000004)|failure threshold is 3, (slot, NP)
failed: (0/2/CPU0, 0)
RP/0/RSP0/CPU0:Feb 5 05:05:46.051 : pfm_node_rp[354]:
%PLATFORM-DIAGS-3-PUNT_FABRIC_DATA_PATH_FAILED : Clear|online_diag_rsp[237686]|
System Punt/Fabric/data Path Test(0x2000004)|failure threshold is 3, (slot, NP)
failed: (0/2/CPU0, 0)
والنهج المقترح للأخطاء العابرة هو فقط رصد حدوث المزيد من هذه الأخطاء. إذا حدث خطأ عابر أكثر من مرة، فقم بمعاملة الخطأ العابر كخطأ فادح، واستخدم التوصيات والخطوات لتحليل هذه الأخطاء الموضحة في القسم التالي.
إذا لم تكن رسالة PFM المجموعة متبوعة برسالة PFM واضحة، فقد حدث خطأ ولم يقم الموجه بإصلاح الخطأ نفسه بواسطة رمز معالجة الأخطاء، أو أن طبيعة خطأ الجهاز غير قابلة للاسترداد. يمكن أن تحدث أعطال صعبة بسبب الظروف البيئية والأعطال التي لا يمكن إصلاحها في مكونات الأجهزة. والنهج المقترح لمواجهة الأخطاء الصعبة هو إستخدام المبادئ التوجيهية المذكورة في قسم تحليل الأخطاء الثابتة.
تم سرد مثال على أعطال الموصلات البينية الصلبة هنا من أجل الوضوح. ل هذا مثال رسالة، هناك ما من يماثل واضح PFM رسالة.
RP/0/RSP0/CPU0:Feb 5 05:05:44.051 : pfm_node_rp[354]:
%PLATFORM-DIAGS-3-PUNT_FABRIC_DATA_PATH_FAILED : Set|online_diag_rsp[237686]|
System Punt/Fabric/data Path Test(0x2000004)|failure threshold is 3, (slot, NP)
failed: (0/2/CPU0, 0)
بموجب سيناريو خطأ ثابت، قم بتجميع جميع الأوامر المذكورة في قسم إنشاء طلب الخدمة"Data to Collection قبل ذلك، وافتح طلب خدمة. في الحالات العاجلة، بعد جمع جميع مخرجات الأمر أستكشاف الأخطاء وإصلاحها، قم ببدء إعادة تحميل بطاقة معالج التوجيه أو بطاقة خط استنادا إلى عملية عزل الخطأ. بعد إعادة التحميل، إذا لم يتم إسترداد الخطأ، ابدأ "تفويض إرجاع المواد" (RMA).
أكمل هذه الخطوات لتحليل الأخطاء العابرة.
show logging | inc “PUNT_FABRIC_DATA_PATH"
أمر لاكتشاف حدوث الخطأ مرة واحدة أو عدة مرات.show pfm location all
أمر لتحديد الحالة الحالية (تعيين أو مسح). هل الخطأ متميز أو تم مسحه؟ في حالة تغيير حالة الخطأ بين SET و CLEAR، يحدث خطأ واحد أو أكثر داخل مسار بيانات البنية بشكل متكرر ويتم تصحيحه إما بواسطة البرنامج أو الجهاز.show pfm location all
إخراج الأمر، والبحث عن سلسلة الخطأ بشكل دوري لمراقبة تكرار الخطأ في المستقبل (عندما تكون الحالة الأخيرة للخطأ واضحة، ولا تحدث أخطاء جديدة).أدخل هذه الأوامر لتحليل الأخطاء العابرة:
show logging | inc “PUNT_FABRIC_DATA_PATH”
show pfm location all
إذا كنت تنظر إلى إرتباطات مسار بيانات البنية على بطاقة خط على أنها شجرة (حيث يتم وصف التفاصيل في قسم معلومات الخلفية)، فيجب عليك حينئذ أن تستنتج - استنادا إلى نقطة الخطأ - ما إذا كان يتعذر الوصول إلى واحدة أو أكثر من نقاط الشبكة (NP). عندما تحدث أخطاء متعددة في نقاط الشبكة (NPs) المتعددة، أستخدم الأوامر المدرجة في هذا القسم لتحليل الأخطاء.
دخلت هذا أمر in order to حللت خطأ صلب:
show logging | inc “PUNT_FABRIC_DATA_PATH”
show controller fabric fia link-status location
show controller fabric crossbar link-status instance <0 and 1> location
show controller fabric crossbar link-status instance 0 location
show controller fabric crossbar link-status instance 0 location 0/rsp0/cpu0
show controller fabric crossbar link-status instance 1 location 0/rsp0/cpu0
show controller fabric crossbar link-status instance 0 location 0/rsp1/cpu0
show controller fabric crossbar link-status instance 1 location 0/rsp1/cpu0
show controller fabric fia link-status location 0/rsp*/cpu0
show controller fabric fia link-status location 0/rsp0/cpu0
show controller fabric fia link-status location 0/rsp1/cpu0
show controller fabric fia bridge sync-status location 0/rsp*/cpu0
show controller fabric fia bridge sync-status location 0/rsp0/cpu0
show controller fabric fia bridge sync-status location 0/rsp1/cpu0
show tech fabric terminal
ملاحظة: إذا أبلغت جميع نقاط الشبكة (NP) على جميع بطاقات الخط عن حدوث خطأ، فمن المرجح أن يكون الخطأ على بطاقة معالج التوجيه (بطاقة معالج التوجيه النشطة أو بطاقة معالج التوجيه الاحتياطي). ارجع إلى الارتباط الذي يربط وحدة المعالجة المركزية لبطاقة معالج التوجيه ب FPGA وبطاقة معالج التوجيه FIA في قسم معلومات الخلفية.
وتاريخيا، يمكن إسترداد 99 بالمائة من الأخطاء، وفي معظم الحالات، يعمل إجراء الاسترداد الذي بدأه البرنامج على إصلاح الأخطاء. ومع ذلك، في حالات نادرة جدا، تظهر أخطاء لا يمكن إصلاحها ولا يمكن إصلاحها إلا مع RMA الخاص بالبطاقات.
تحدد الأقسام التالية بعض حالات الفشل السابقة التي تمت مواجهتها من أجل إستخدامها كإرشادات في حالة ملاحظة أخطاء مماثلة.
تظهر هذه الرسائل إذا كان الخطأ ناجما عن زيادة اشتراك NP.
RP/0/RP1/CPU0:Jun 26 13:08:28.669 : pfm_node_rp[349]:
%PLATFORM-DIAGS-3-PUNT_FABRIC_DATA_PATH_FAILED : Set|online_diag_rsp[200823]|
System Punt/Fabric/data Path Test(0x2000004)|failure threshold is 3, (slot, NP)
failed: (0/10/CPU0, 0)
RP/0/RP1/CPU0:Jun 26 13:09:28.692 : pfm_node_rp[349]:
%PLATFORM-DIAGS-3-PUNT_FABRIC_DATA_PATH_FAILED : Clear|online_diag_rsp[200823]|
System Punt/Fabric/data Path Test(0x2000004)|failure threshold is 3, (slot, NP)
failed: (0/10/CPU0,0)
قد يكون تأكيد الأخطاء العابرة أكثر صعوبة. تتمثل إحدى الطرق لتحديد ما إذا كان هناك حاليا اشتراك زائد في بروتوكول الشبكة (NP) أو أن هناك اشتراكا زائدا في الماضي في التحقق من وجود نوع معين من السقوط داخل بروتوكول الشبكة ومن حالات السقوط في بروتوكول FIA. تقع ميزة الوصول المباشر إلى الذاكرة (IFDMA) داخل بروتوكول الشبكة (NP) عند زيادة الاشتراك في بروتوكول الشبكة (NP) وعدم قدرتها على مواكبة حركة المرور الواردة. تحدث عمليات السقوط من خلال خط FIA عندما يؤكد بروتوكول الشبكة (NP) الخاص بالمنفذ على التحكم في التدفق (يطلب من بطاقة الخط الخاصة بالمدخل إرسال حركة مرور أقل). وفقا لسيناريو التحكم في التدفق، يحتوي FIA المدخل على حالات هبوط في الذيل.
فيما يلي مثال:
RP/0/RSP0/CPU0:RP/0/RSP0/CPU0:ASR9006-C#show controllers np counters all
Wed Feb 19 13:10:11.848 EST
Node: 0/1/CPU0:
----------------------------------------------------------------
Show global stats counters for NP0, revision v3
Read 93 non-zero NP counters:
Offset Counter FrameValue Rate (pps)
-----------------------------------------------------------------------
22 PARSE_ENET_RECEIVE_CNT 46913080435 118335
23 PARSE_FABRIC_RECEIVE_CNT 40175773071 5
24 PARSE_LOOPBACK_RECEIVE_CNT 5198971143966 0
<SNIP>
Show special stats counters for NP0, revision v3
Offset Counter CounterValue
----------------------------------------------------------------------------
524032 IFDMA discard stats counters 0 8008746088 0 <<<<<
فيما يلي مثال:
RP/0/RSP0/CPU0:ASR9006-C#show controllers fabric fia drops ingress location 0/1/cPU0
Wed Feb 19 13:37:27.159 EST
********** FIA-0 **********
Category: in_drop-0
DDR Rx FIFO-0 0
DDR Rx FIFO-1 0
Tail Drop-0 0 <<<<<<<
Tail Drop-1 0 <<<<<<<
Tail Drop-2 0 <<<<<<<
Tail Drop-3 0 <<<<<<<
Tail Drop DE-0 0
Tail Drop DE-1 0
Tail Drop DE-2 0
Tail Drop DE-3 0
Hard Drop-0 0
Hard Drop-1 0
Hard Drop-2 0
Hard Drop-3 0
Hard Drop DE-0 0
Hard Drop DE-1 0
Hard Drop DE-2 0
Hard Drop DE-3 0
WRED Drop-0 0
WRED Drop-1 0
WRED Drop-2 0
WRED Drop-3 0
WRED Drop DE-0 0
WRED Drop DE-1 0
WRED Drop DE-2 0
WRED Drop DE-3 0
Mc No Rep 0
عند حدوث PUNT_FABRIC_DATA_PATH_FAILED، وإذا كان الفشل بسبب إعادة الضبط السريع لبروتوكول NP، تظهر السجلات المماثلة لما هو مدرج هنا لبطاقة خط مستندة إلى إعصار. وتتوفر آلية رصد الصحة على بطاقات خطوط مستندة إلى الإعصار، ولكن ليس على بطاقات خطوط مستندة إلى ترايدنت.
LC/0/2/CPU0:Aug 26 12:09:15.784 CEST: prm_server_ty[303]:
prm_inject_health_mon_pkt : Error injecting health packet for NP0
status = 0x80001702
LC/0/2/CPU0:Aug 26 12:09:18.798 CEST: prm_server_ty[303]:
prm_inject_health_mon_pkt : Error injecting health packet for NP0
status = 0x80001702
LC/0/2/CPU0:Aug 26 12:09:21.812 CEST: prm_server_ty[303]:
prm_inject_health_mon_pkt : Error injecting health packet for NP0
status = 0x80001702
LC/0/2/CPU0:Aug 26 12:09:24.815 CEST:
prm_server_ty[303]: NP-DIAG health monitoring failure on NP0
LC/0/2/CPU0:Aug 26 12:09:24.815 CEST: pfm_node_lc[291]:
%PLATFORM-NP-0-NP_DIAG : Set|prm_server_ty[172112]|
Network Processor Unit(0x1008000)| NP diagnostics warning on NP0.
LC/0/2/CPU0:Aug 26 12:09:40.492 CEST: prm_server_ty[303]:
Starting fast reset for NP 0 LC/0/2/CPU0:Aug 26 12:09:40.524 CEST:
prm_server_ty[303]: Fast Reset NP0 - successful auto-recovery of NP
لبطاقات الخط المستندة إلى Trident، يظهر هذا السجل بإعادة ضبط سريعة ل NP:
LC/0/1/CPU0:Mar 29 15:27:43.787 test:
pfm_node_lc[279]: Fast Reset initiated on NP3
قامت Cisco بحل مشكلة حيث يتم إعادة تدريب الارتباطات النسيجية النادرة بين معالج التحويل والتوجيه (RSP) 440 وبطاقات الخط المستندة إلى الإعصار عبر اللوحة الخلفية. تتم إعادة تدريب روابط البنية لأن قوة الإشارة ليست مثالية. هذا إصدار حاضر في إصدارات البرنامج Cisco IOS® XR الأساسية 4.2.1 و 4.2.2 و 4.2.3 و 4.3.0 و 4.3.1 و 4.3.2. يتم نشر تحديث صيانة البرامج (SMU) لكل من هذه الإصدارات على اتصال Cisco Connection Online، ويتم تتبعه باستخدام معرف تصحيح الأخطاء من Cisco CSCuj10837 ومعرف تصحيح الأخطاء من Cisco CSCul39674.
عندما يقع هذا إصدار على المسحاج تخديد، أي من هذا سيناريو يستطيع وقعت:
لتأكيد ذلك، قم بجمع مخرجات التتبع من عنصر التحكم في الشبكة (LC) وكلا عنصري خوادم RSP (RSP) (show controller fabric crossbar ltrace location <>
) والتحقق مما إذا كان هذا الإخراج مرئيا في مسارات RSP:
وحدة SMU متوفرة بالفعل
فيما يلي مثال:
RP/0/RSP0/CPU0:ios#show controllers fabric ltrace crossbar location 0/rsp0/cpu0 |
in link_retrain
Oct 1 08:22:58.999 crossbar 0/RSP1/CPU0 t1 detail xbar_fmlc_handle_link_retrain:
rcvd link_retrain for (1,1,0),(2,1,0),1.
RP/0/RSP0/CPU0:ios#show controllers fabric ltrace crossbar location 0/0/cpu0 |
in link_retrain
Oct 1 08:22:58.967 crossbar 0/0/CPU0 t1 init xbar_trigger_link_retrain:
destslot:0 fmlgrp:3 rc:0
Oct 1 08:22:58.967 crossbar 0/0/CPU0 t1 detail xbar_pfm_alarm_callback:
xbar_trigger_link_retrain(): (2,0,7) initiated
Oct 1 08:22:58.969 crossbar 0/0/CPU0 t1 detail xbar_fmlc_handle_link_retrain:
rcvd link_retrain for (2,1,0),(2,2,0),0.
يشير مصطلح إتجاه TX إلى الإتجاه من وجهة نظر واجهة قناة RSPs الشاملة للقناة الليفية إلى واجهة شريط متقاطع للقناة الليفية على بطاقة خط مستندة إلى إعصار.
يتميز معرف تصحيح الأخطاء من Cisco CSCuj10837 باكتشاف بطاقة خط الإعصار لمشكلة على رابط RX من RSP وبدء إعادة تدريب إرتباط. يمكن لأي جانب (LC أو RSP) بدء حدث إعادة التدريب. في حالة وجود معرف تصحيح الأخطاء من Cisco CSCuj10837، يقوم LC ببدء إعادة التدريب ويمكن الكشف عنه بواسطة init xbar_trigger_link_retrain: رسالة في التتبع على عنصر التحكم في الوصول (LC).
RP/0/RSP0/CPU0:ios#show controllers fabric ltrace crossbar location 0/0/cpu0 |
in link_retrain
Oct 1 08:22:58.967 crossbar 0/0/CPU0 t1 init xbar_trigger_link_retrain: destslot:
0 fmlgrp:3 rc:0
عندما يبدأ ال LC إعادة التدريب، ال RSP يبلغ عن rcvd link_retrain في التتبع إنتاج.
RP/0/RSP0/CPU0:ios#show controllers fabric ltrace crossbar location 0/rsp0/cpu0 |
in link_retrain
Oct 1 08:22:58.999 crossbar 0/RSP1/CPU0 t1 detail xbar_fmlc_handle_link_retrain:
rcvd link_retrain for (1,1,0),(2,1,0),1.
لتأكيد ذلك، قم بجمع مخرجات التتبع من بطاقة الخط وكل من RSPs (show controller fabric crossbar ltrace location <>
) والتحقق مما إذا كان هذا الإخراج مرئيا في مسارات RSP:
فيما يلي مثال:
RP/0/RSP0/CPU0:asr9k-2#show controllers fabric ltrace crossbar location 0/0/cpu0 |
in link_retrain
Jan 8 17:28:39.215 crossbar 0/0/CPU0 t1 detail xbar_fmlc_handle_link_retrain:
rcvd link_retrain for (0,1,0),(5,1,1),0.
RP/0/RSP0/CPU0:asr9k-2#show controllers fabric ltrace crossbar location 0/rsp0/cpu0 |
in link_retrain
Jan 8 17:28:39.207 crossbar 0/RSP1/CPU0 t1 init xbar_trigger_link_retrain:
destslot:4 fmlgrp:3 rc:0
Jan 8 17:28:39.207 crossbar 0/RSP1/CPU0 t1 detail xbar_pfm_alarm_callback:
xbar_trigger_link_retrain(): (5,1,11) initiated
Jan 8 17:28:39.256 crossbar 0/RSP1/CPU0 t1 detail xbar_fmlc_handle_link_retrain:
rcvd link_retrain for (5,1,1),(0,1,0),0.
يشير مصطلح إتجاه RX إلى الإتجاه من وجهة نظر واجهة قناة RSPs للقناة الليفية المتقاطعة من واجهة شريط متقاطع للقنوات الليفية على بطاقة خط مستندة إلى إعصار.
يتميز معرف تصحيح الأخطاء من Cisco CSCul39674 باكتشاف RSP لمشكلة على إرتباط RX من بطاقة خط الإعصار وبدء إعادة تدريب إرتباط. يمكن لأي جانب (LC أو RSP) بدء حدث إعادة التدريب. في حالة معرف تصحيح الأخطاء من Cisco CSCul39674، يقوم RSP ببدء إعادة التدريب ويمكن الكشف عنه بواسطة init xbar_trigger_link_retrain: الرسالة الموجودة في التتبع على RSP.
RP/0/RSP0/CPU0:asr9k-2#show controllers fabric ltrace crossbar location 0/rsp0/cpu0 |
in link_retrain
Jan 8 17:28:39.207 crossbar 0/RSP1/CPU0 t1 init xbar_trigger_link_retrain: destslot:4 fmlgrp:
3 rc:0
عندما يبدأ RSP إعادة التدريب، يقوم LC بالإعلام عن حدث rcvd link_retrain في إخراج التتبع.
RP/0/RSP0/CPU0:asr9k-2#show controllers fabric ltrace crossbar location 0/0/cpu0 |
in link_retrain
Jan 8 17:28:39.215 crossbar 0/0/CPU0 t1 detail xbar_fmlc_handle_link_retrain:
rcvd link_retrain for (0,1,0),(5,1,1),0.
تم القيام بعمل هام من أجل تقليل الوقت المستغرق لإعادة تدريب إرتباط قناة ليفية في الإصدار 4.3.2 من Cisco IOS XR والإصدارات الأحدث. يقع الآن إعادة تكوين البنية في الأوقات الفرعية الثانية ولا يمكن ملاحظته لتدفقات حركة المرور. في cisco IOS XR إطلاق 4.3.2، فقط هذا syslog رسالة رأيت عندما بناء خطوة ربط.
%PLATFORM-FABMGR-5-FABRIC_TRANSIENT_FAULT : Fabric backplane crossbar link
underwent link retraining to recover from a transient error: Physical slot 1
أصلحت Cisco مشكلة حيث يمكن إعادة تعيين ASIC (FIA) للبنية بسبب حالة تجاوز سعة التخزين التي لا يمكن إستردادها أولا من الإخراج (FIFO). يتم معالجة هذا الأمر باستخدام معرف تصحيح الأخطاء من Cisco CSCul66510. تؤثر هذه المشكلة فقط على بطاقات الخط المستندة إلى Trident ولا تتم مواجهتها إلا في حالات نادرة مع إزدحام شديد في مسار الدخول. إن واجهت هذا إصدار يكون، هذا syslog رسالة قبل أن ال linecard يكون أعدت أن يسترد من الشرط.
RP/0/RSP0/CPU0:asr9k-2#show log
LC/0/3/CPU0:Nov 13 03:46:38.860 utc: pfm_node_lc[284]:
%FABRIC-FIA-0-ASIC_FATAL_FAULT Set|fialc[159814]
|Fabric Interface(0x1014000)|Fabric interface asic ASIC1 encountered fatal
fault 0x1b - OC_DF_INT_PROT_ERR_0
LC/0/3/CPU0:Nov 13 03:46:38.863 utc: pfm_node_lc[284]:
%PLATFORM-PFM-0-CARD_RESET_REQ : pfm_dev_sm_perform_recovery_action,
Card reset requested by: Process ID:159814 (fialc), Fault Sev: 0, Target node:
0/3/CPU0, CompId: 0x10, Device Handle: 0x1014000, CondID: 2545, Fault Reason:
Fabric interface asic ASIC1 encountered fatal fault 0x1b - OC_DF_INT_PROT_ERR_0
أصلحت Cisco مشكلة حيث قد يؤدي الازدحام الشديد الموسع إلى إستهلاك موارد البنية وفقدان حركة مرور البيانات. ويمكن أن تحدث خسارة حركة المرور حتى على التدفقات غير المرتبطة. عولجت هذا مشكلة مع cisco بق id CSCug90300 وحللت في cisco IOS XR إطلاق 4.3.2 وفيما بعد. يتم تسليم الإصلاح أيضا في Cisco IOS XR الإصدار 4.2.3 CSMU#3، Cisco بق id CSCui33805. ويمكن مواجهة هذه المشكلة النادرة على بطاقات خطوط من نوع ترايدنت أو إعصار.
تجميع مخرجات من هذه الأوامر:
show tech-support fabric
show controller fabric fia bridge flow-control location
<===== الحصول على هذا المخرج لجميع LCsshow controllers fabric fia q-depth location
فيما يلي بعض النتائج:
RP/0/RSP0/CPU0:asr9k-1#show controllers fabric fia q-depth location 0/6/CPU0
Sun Dec 29 23:10:56.307 UTC
********** FIA-0 **********
Category: q_stats_a-0
Voq ddr pri pktcnt
11 0 2 7
********** FIA-0 **********
Category: q_stats_b-0
Voq ddr pri pktcnt
********** FIA-1 **********
Category: q_stats_a-1
Voq ddr pri pktcnt
11 0 0 2491
11 0 2 5701
********** FIA-1 **********
Category: q_stats_b-1
Voq ddr pri pktcnt
RP/0/RSP0/CPU0:asr9k-1#
RP/0/RSP0/CPU0:asr9k-1#show controllers pm location 0/1/CPU0 | in "switch|if"
Sun Dec 29 23:37:05.621 UTC
Ifname(2): TenGigE0_1_0_2, ifh: 0x2000200 : <==Corresponding interface ten 0/1/0/2
iftype 0x1e
switch_fabric_port 0xb <==== VQI 11
parent_ifh 0x0
parent_bundle_ifh 0x80009e0
RP/0/RSP0/CPU0:asr9k-1#
في ظل ظروف غير محددة، من غير المرجح أن ترى VOQ مع وضع الحزم في قائمة الانتظار. هذا الأمر هو لقطة سريعة في الوقت الحقيقي لقوائم انتظار FIA. من الشائع أن لا يعرض هذا الأمر أي حزم في قائمة الانتظار على الإطلاق.
الأخطاء البسيطة هي أخطاء غير دائمة تتسبب في عدم مزامنة جهاز الحالة. وتعتبر هذه على أنها التحقق الدوري من التكرار (CRC)، أو تسلسل التحقق من الإطارات (FCS)، أو الحزم الخطأ على جانب البنية من NP أو على جانب الدخول من FIA.
هنا بعض الأمثلة من كيف هذا إصدار يستطيع أن يرى:
RP/0/RSP0/CPU0:asr9k-1#show controllers fabric fia drops ingress location 0/3/CPU0
Fri Dec 6 19:50:42.135 UTC
********** FIA-0 **********
Category: in_drop-0
DDR Rx FIFO-0 0
DDR Rx FIFO-1 32609856 <=== Errors
RP/0/RSP0/CPU0:asr9k-1#show controllers fabric fia errors ingress location 0/3/CPU0
Fri Dec 6 19:50:48.934 UTC
********** FIA-0 **********
Category: in_error-0
DDR Rx CRC-0 0
DDR Rx CRC-1 32616455 <=== Errors
RP/0/RSP1/CPU0:asr9k-1#show controllers fabric fia bridge stats location 0/0/CPU0
Ingress Drop Stats (MC & UC combined)
**************************************
PriorityPacket Error Threshold
Direction Drops Drops
--------------------------------------------------
LP NP-3 to Fabric 0 0
HP NP-3 to Fabric 1750 0
RP/0/RSP1/CPU0:asr9k-1#
RP/0/RSP1/CPU0:asr9k-1#show controllers fabric fia bridge stats location 0/6/CPU0
Sat Jan 4 06:33:41.392 CST
********** FIA-0 **********
Category: bridge_in-0
UcH Fr Np-0 16867506
UcH Fr Np-1 115685
UcH Fr Np-2 104891
UcH Fr Np-3 105103
UcL Fr Np-0 1482833391
UcL Fr Np-1 31852547525
UcL Fr Np-2 3038838776
UcL Fr Np-3 30863851758
McH Fr Np-0 194999
McH Fr Np-1 793098
McH Fr Np-2 345046
McH Fr Np-3 453957
McL Fr Np-0 27567869
McL Fr Np-1 12613863
McL Fr Np-2 663139
McL Fr Np-3 21276923
Hp ErrFrNp-0 0
Hp ErrFrNp-1 0
Hp ErrFrNp-2 0
Hp ErrFrNp-3 0
Lp ErrFrNp-0 0
Lp ErrFrNp-1 0
Lp ErrFrNp-2 0
Lp ErrFrNp-3 0
Hp ThrFrNp-0 0
Hp ThrFrNp-1 0
Hp ThrFrNp-2 0
Hp ThrFrNp-3 0
Lp ThrFrNp-0 0
Lp ThrFrNp-1 0
Lp ThrFrNp-2 0
Lp ThrFrNp-3 0
********** FIA-0 **********
Category: bridge_eg-0
UcH to Np-0 779765
UcH to Np-1 3744578
UcH to Np-2 946908
UcH to Np-3 9764723
UcL to Np-0 1522490680
UcL to Np-1 32717279812
UcL to Np-2 3117563988
UcL to Np-3 29201555584
UcH ErrToNp-0 0
UcH ErrToNp-1 0
UcH ErrToNp-2 129 <==============
UcH ErrToNp-3 0
UcL ErrToNp-0 0
UcL ErrToNp-1 0
UcL ErrToNp-2 90359 <==========
تجميع مخرجات من هذه الأوامر:
show tech-support fabric
show tech-support np
show controller fabric fia bridge stats location <>
(الحصول على عدة مرات)أسلوب الاسترداد هو إعادة تحميل بطاقة الخط المتأثرة.
RP/0/RSP0/CPU0:asr9k-1#hw-module location 0/6/cpu0 reload
يعرض الأمر show diagnostic result location
يوفر الأمر ملخصا لجميع الاختبارات التشخيصية وحالات الفشل عبر الإنترنت بالإضافة إلى آخر طابع زمني عند إجتياز الاختبار. معرف الاختبار لفشل مسار بيانات البنية الصغيرة هو 10. يمكن رؤية قائمة بجميع الاختبارات مع تردد حزم الاختبار مع show diagnostic content location
erasecat4000_flash:.
يماثل إخراج نتيجة إختبار مسار بيانات Punt Fabric مخرجات هذا النموذج:
RP/0/RSP0/CPU0:ios(admin)#show diagnostic result location 0/rsp0/cpu0 test 10 detail
Current bootup diagnostic level for RP 0/RSP0/CPU0: minimal
Test results: (. = Pass, F = Fail, U = Untested)
___________________________________________________________________________
10 ) FabricLoopback ------------------> .
Error code ------------------> 0 (DIAG_SUCCESS)
Total run count -------------> 357
Last test execution time ----> Sat Jan 10 18:55:46 2009
First test failure time -----> n/a
Last test failure time ------> n/a
Last test pass time ---------> Sat Jan 10 18:55:46 2009
Total failure count ---------> 0
Consecutive failure count ---> 0
كما هو موضح في معرف تصحيح الأخطاء من Cisco CSCuc04493، هناك الآن طريقة لجعل الموجه يعطل تلقائيا جميع المنافذ التي ترتبط بأخطاء PUNT_FABRIC_DATA_PATH الناشئة على RP/RSP النشط.
يتم تعقب الطريقة الأولى عبر معرف تصحيح الأخطاء من Cisco CSCuc04493. ل صيغة 4.2.3، تضمنت هذا في cisco بق id CSCui33805. في هذا صيغة، ثبتت أن تلقائيا عطلت all of the ميناء أن يكون صحبت مع ال NPs أن يكون تأثرت.
هنا مثال أن يبدي كيف ال syslogs أن يظهر:
RP/0/RSP0/CPU0:Jun 10 16:11:26 BKK: pfm_node_rp[359]:
%PLATFORM-DIAGS-3-PUNT_FABRIC_DATA_PATH_FAILED : Set|online_diag_rsp[237686]|System
Punt/Fabric/data Path Test(0x2000004)|failure threshold is 3, (slot, NP) failed:
(0/1/CPU0, 0)
LC/0/1/CPU0:Jun 10 16:11:27 BKK: ifmgr[204]: %PKT_INFRA-LINK-3-UPDOWN : Interface
TenGigE0/1/0/0, changed state to Down
LC/0/1/CPU0:Jun 10 16:11:27 BKK: ifmgr[204]: %PKT_INFRA-LINEPROTO-5-UPDOWN : Line
protocol on Interface TenGigE0/1/0/0, changed state to Down
LC/0/1/CPU0:Jun 10 16:11:27 BKK: ifmgr[204]: %PKT_INFRA-LINK-3-UPDOWN : Interface
TenGigE0/1/0/1, changed state to Down
LC/0/1/CPU0:Jun 10 16:11:27 BKK: ifmgr[204]: %PKT_INFRA-LINEPROTO-5-UPDOWN : Line
protocol on Interface TenGigE0/1/0/1, changed state to Down
تشير وحدة التحكم إلى أن سبب انقطاع الواجهة يرجع إلى DATA_PATH_DOWN
. فيما يلي مثال:
RP/0/RSP0/CPU0:ASR9006-E#show controllers gigabitEthernet 0/0/0/13 internal
Wed Dec 18 02:42:52.221 UTC
Port Number : 13
Port Type : GE
Transport mode : LAN
BIA MAC addr : 6c9c.ed08.3cbd
Oper. MAC addr : 6c9c.ed08.3cbd
Egress MAC addr : 6c9c.ed08.3cbd
Port Available : true
Status polling is : enabled
Status events are : enabled
I/F Handle : 0x04000400
Cfg Link Enabled : tx/rx enabled
H/W Tx Enable : no
UDLF enabled : no
SFP PWR DN Reason : 0x00000000
SFP Capability : 0x00000024
MTU : 1538
H/W Speed : 1 Gbps
H/W Duplex : Full
H/W Loopback Type : None
H/W FlowCtrl type : None
H/W AutoNeg Enable: Off
H/W Link Defects : (0x00080000) DATA_PATH_DOWN <<<<<<<<<<<
Link Up : no
Link Led Status : Link down -- Red
Input good underflow : 0
Input ucast underflow : 0
Output ucast underflow : 0
Input unknown opcode underflow: 0
Pluggable Present : yes
Pluggable Type : 1000BASE-LX
Pluggable Compl. : (Service Un) - Compliant
Pluggable Type Supp.: (Service Un) - Supported
Pluggable PID Supp. : (Service Un) - Supported
Pluggable Scan Flg: false
في الإصدارات 4.3.1 والإصدارات الأحدث، يجب تمكين هذا السلوك. هناك أمر admin-config جديد يتم إستخدامه لتنفيذ هذا الأمر. بما أن السلوك الافتراضي لم يعد أن يعطل الميناء، هذا ينبغي كنت شكلت يدويا.
RP/0/RSP1/CPU0:ASR9010-A(admin-config)#fault-manager datapath port ?
shutdown Enable auto shutdown
toggle Enable auto toggle port status
على 64-بت cisco ios XR التشكيل يتوفر أمر في ال xr VM (ليس في ال sysadmin VM):
RP/0/RSP0/CPU0:CORE-TOP(config)#fault-manager datapath port ?
shutdown Enable auto shutdown
toggle Enable auto toggle port status
يعالج معرف تصحيح الأخطاء من Cisco CSCui15435 الأخطاء البسيطة التي يتم رؤيتها على بطاقات الخط المستندة إلى Trident، كما هو موضح في تأثير حركة المرور بسبب أخطاء soft في Bridge/FPGA على قسم بطاقات الخط المستندة إلى Trident. يستخدم هذا طريقة اكتشاف مختلفة عن طريقة التشخيص العادية الموضحة في معرف تصحيح الأخطاء من Cisco CSCuc04493.
قدم هذا الخطأ أيضا أمر CLI جديد admin-config:
(admin-config)#fabric fia soft-error-monitor <1|2> location
1 = shutdown the ports
2 = reload the linecard
Default behavior: no action is taken.
عند مواجهة هذا الخطأ، يمكن ملاحظة syslog هذا:
RP/0/RSP0/CPU0:Apr 30 22:17:11.351 : config[65777]: %MGBL-SYS-5-CONFIG_I : Configured
from console by root
LC/0/2/CPU0:Apr 30 22:18:52.252 : pfm_node_lc[283]:
%PLATFORM-BRIDGE-1-SOFT_ERROR_ALERT_1 : Set|fialc[159814]|NPU
Crossbar Fabric Interface Bridge(0x1024000)|Soft Error Detected on Bridge instance 1
RP/0/RSP0/CPU0:Apr 30 22:21:28.747 : pfm_node_rp[348]:
%PLATFORM-DIAGS-3-PUNT_FABRIC_DATA_PATH_FAILED : Set|online_diag_rsp[237686]|
System Punt/Fabric/data Path Test(0x2000004)|failure threshold is 3, (slot, NP) failed:
(0/2/CPU0, 2) (0/2/CPU0, 3)
LC/0/2/CPU0:Apr 30 22:21:29.707 : ifmgr[194]: %PKT_INFRA-LINK-3-UPDOWN :
Interface TenGigE0/2/0/2, changed state to Down
LC/0/2/CPU0:Apr 30 22:21:29.707 : ifmgr[194]: %PKT_INFRA-LINEPROTO-5-UPDOWN :
Line protocol on Interface TenGigE0/2/0/2, changed state to Down
RP/0/RSP1/CPU0:Apr 30 22:21:35.086 : pfm_node_rp[348]:
%PLATFORM-DIAGS-3-PUNT_FABRIC_DATA_PATH_FAILED :
Set|online_diag_rsp[237646]|System Punt/Fabric/data Path Test(0x2000004)|failure
threshold is 3, (slot, NP) failed: (0/2/CPU0, 2) (0/2/CPU0, 3)
عندما يتم إيقاف تشغيل المنافذ المتأثرة، فإنها تسمح بتقويم الشبكة بتولي الأمر وتجنب تقييد حركة المرور بالأسود. لاسترداد، يجب إعادة تحميل بطاقة الخط.
Q. هل ترسل بطاقة معالج المسار الأساسية أو الاحتياطية حزم keepalives أو التشخيصات عبر الإنترنت إلى كل NP في النظام؟
ج. نعم. ترسل كلتا بطاقتي معالج التوجيه حزم تشخيص عبر الإنترنت إلى كل NP.
Q. هل المسار هو نفسه عندما تكون بطاقة معالج التوجيه واحدة (RSP1) نشطة؟
a. مسار التشخيص هو نفسه ل RSP0 أو RSP1. يعتمد المسار على حالة RSP. راجع قسم مسار حزمة تشخيص Punt Fabric في هذا المستند للحصول على مزيد من التفاصيل.
Q. كم مرة ترسل RSPs حزم تشخيص، وكم حزمة تشخيص يجب تفويتها قبل تشغيل تنبيه؟
a. يرسل كل RSP بشكل مستقل حزمة تشخيص إلى كل NP مرة واحدة في الدقيقة. يمكن أن يقوم RSP بتشغيل تنبيه إذا لم يتم التعرف على ثلاث حزم تشخيصية.
س. كيف يمكنك تحديد ما إذا كان هناك اشتراك زائد في NP أم لا؟
ألف - ومن طرق التحقق مما إذا كان هناك حاليا اشتراك زائد في بروتوكول الشبكة الوطنية أو ما إذا كان هناك اشتراك زائد فيه في الماضي هو التحقق من حدوث نوع معين من الانخفاض داخل البرنامج ومن حالات السقوط في مؤشر FIA. تقع ميزة الوصول المباشر إلى الذاكرة (IFDMA) داخل بروتوكول الشبكة (NP) عند زيادة الاشتراك في بروتوكول الشبكة (NP) وعدم قدرتها على مواكبة حركة المرور الواردة. تحدث عمليات السقوط من خلال خط FIA عندما تؤكد نقطة الشبكة (NP) الخاصة بالمنفذ على التحكم في التدفق (يطلب من بطاقة الخط الخاصة بالمدخل إرسال حركة مرور أقل). وفقا لسيناريو التحكم في التدفق، يحتوي FIA المدخل على حالات هبوط في الذيل.
س. كيف يمكنك تحديد ما إذا كان هناك خطأ يتطلب إعادة تعيينه من قبل NP؟
a. بشكل نموذجي، يتم مسح خطأ NP بواسطة إعادة تعيين سريعة. يتم عرض سبب إعادة التعيين بسرعة في السجلات.
س. هل من الممكن إعادة تعيين NP يدويا؟
أي نعم من بطاقة الخط ksh:
run attach 0/[x]/CPU0 #show_np -e [np#] -d fast_reset
Q. ماذا يعرض في حالة تعطل جهاز غير قابل للاسترداد في إحدى وحدات التخزين المتصلة بالشبكة؟
A. يمكنك مشاهدة فشل مسار بيانات البنية لمحول NP هذا بالإضافة إلى فشل إختبار إسترجاع NP. تتم مناقشة رسالة فشل إختبار إسترجاع NP في قسم الملحق في هذا المستند.
Q. هل ستعود حزمة التشخيص التي يتم الحصول عليها من بطاقة معالج توجيه واحدة إلى نفس البطاقة؟
a. نظرا لأن الحزم التشخيصية يتم الحصول عليها من كل من بطاقات معالج التوجيه وتتبعها على أساس بطاقة معالج المسار، فإنه يتم إعادة حزمة تشخيص يتم الحصول عليها من بطاقة معالج التوجيه مرة أخرى إلى بطاقة معالج التوجيه نفسه بواسطة NP.
Q.يوفر معرف تصحيح الأخطاء من Cisco CSCuj10837 SMU إصلاحا لحدث إعادة تدريب إرتباط البنية. هل هذا هو السبب والحل للعديد من حالات فشل مسار بيانات البنية البرمجية؟
a. نعم، هو مطلوب لتحميل SMU التي تحل محل معرف الأخطاء من Cisco CSCul39674 لتجنب أحداث إعادة تدريب إرتباط البنية.
س. كم من الوقت يستغرق لإعادة تدريب الارتباطات النسيجية بمجرد إتخاذ القرار بذلك؟
أ. يتم إتخاذ قرار إعادة التدريب بمجرد اكتشاف فشل رابط. قبل الإصدار 4-3-2، يمكن أن تستغرق عملية إعادة التدريب عدة ثوان. وبعد الإصدار 4-3-2، تحسن وقت إعادة التدريب تحسنا كبيرا، وهو يستغرق أقل من ثانية.
س. ما هي النقطة التي تم فيها إتخاذ قرار إعادة تدريب وصلة نسيجية؟
أ. بمجرد اكتشاف خطأ الارتباط، يتم إتخاذ قرار إعادة التدريب بواسطة برنامج تشغيل ASIC للبنية.
س. هل هو فقط بين FIA على بطاقة معالج مسار نشط والنسيج الذي تستخدمه أول إرتباط، وبعد ذلك هو أقل إرتباط يتم تحميله عندما يكون هناك روابط متعددة متاحة؟
ألف - صحيح. يتم إستخدام الارتباط الأول الذي يتصل بمثيل XBAR الأول على معالج التوجيه النشط لضخ حركة مرور البيانات في البنية. يمكن أن تصل حزمة الاستجابة من NP مرة أخرى إلى بطاقة معالج التوجيه النشط على أي من الروابط التي تتصل ببطاقة معالج التوجيه. يعتمد إختيار الرابط على حمل الرابط.
Q. أثناء إعادة التدريب، هل يتم فقد جميع الحزم التي يتم إرسالها عبر إرتباط البنية هذا؟
ألف - نعم، ولكن بفضل التحسينات التي أدخلت على الإصدار 4-3-2 وما بعده، لا يمكن الكشف فعليا عن إعادة التدريب. ومع ذلك، في التعليمات البرمجية السابقة، قد يستغرق إعادة التدريب عدة ثوان، مما يؤدي إلى فقد الحزم لذلك الإطار الزمني.
Q. كم مرة تتوقع أن ترى حدث إعادة تدريب إرتباط بنية XBAR بعد أن تقوم بالترقية إلى إصدار أو SMU باستخدام الإصلاح لمعرف تصحيح الأخطاء من Cisco CSCuj10837؟
a. حتى مع إصلاح معرف تصحيح الأخطاء من Cisco CSCuj10837، ما يزال من الممكن رؤية إعادة توجيه إرتباط البنية بسبب معرف تصحيح الأخطاء من Cisco CSCul39674. ولكن بمجرد الحصول على الإصلاح الخاص بمعرف تصحيح الأخطاء من Cisco CSCul39674، لا يجب إجراء إعادة التدريب على إرتباط البنية على إرتباطات اللوحة الخلفية الليفية بين RSP440 وبطاقات الخط المستندة إلى الإعصار. إذا كان كذلك، فعليك رفع طلب خدمة مع مركز المساعدة التقنية (TAC) من Cisco لاستكشاف المشكلة وإصلاحها.
q. هل يؤثر معرف تصحيح الأخطاء من Cisco CSCuj10837 ومعرف تصحيح الأخطاء من Cisco CSCul39674 على RP على ASR 9922 باستخدام بطاقات خطوط مستندة إلى الإعصار؟
أ. نعم
Q. هل يؤثر معرف تصحيح الأخطاء من Cisco CSCuj10837 ومعرف تصحيح الأخطاء من Cisco CSCul39674 على موجهات ASR-9001 و ASR-9001-S؟
أ. لا
Q. إذا واجهت فشل فتحة غير موجودة مع هذه الرسالة، "PLATFORM-DIAGS-3-PUNT_FABRIC_DATA_PATH_FAILED: Set|online_diag_rsp[237686]|System Punt/Fabric/Data Path Test(0x200004)|عتبة الفشل هي 3، (slot، NP) فشلت: (8، 0)،" في هيكل مكون من 10 فتحات، يحتوي على الفتحة المشكلة؟
a. في الإصدارات السابقة، يجب عليك حساب التعيينات المادية والمنطقية كما هو موضح هنا. في هذا مثال، يماثل شق مكان 8 0/6/CPU0.
For 9010 (10 slot chassis)
L P
#0 --- #0
#1 --- #1
#2 --- #2
#3 --- #3
RSP0 --- #4
RSP1 --- #5
#4 --- #6
#5 --- #7
#6 --- #8
#7 --- #9
For 9006 (6 slot chassis)
L P
RSP0 --- #0
RSP1 --- #1
#0 --- #2
#1 --- #3
#2 --- #4
#3 --- #5
هنا الحد الأدنى للأوامر لتجميع الإخراج قبل إتخاذ أي إجراء:
show logging
show pfm location all
admin show diagn result loc 0/rsp0/cpu0 test 8 detail
admin show diagn result loc 0/rsp1/cpu0 test 8 detail
admin show diagn result loc 0/rsp0/cpu0 test 9 detail
admin show diagn result loc 0/rsp1/cpu0 test 9 detail
admin show diagn result loc 0/rsp0/cpu0 test 10 detail
admin show diagn result loc 0/rsp1/cpu0 test 10 detail
admin show diagn result loc 0/rsp0/cpu0 test 11 detail
admin show diagn result loc 0/rsp1/cpu0 test 11 detail
show controller fabric fia link-status location
show controller fabric fia link-status location
show controller fabric fia bridge sync-status location
show controller fabric crossbar link-status instance 0 location
show controller fabric crossbar link-status instance 0 location
show controller fabric crossbar link-status instance 1 location
show controller fabric ltrace crossbar location
show controller fabric ltrace crossbar location
show tech fabric location
file
show tech fabric location
file
فيما يلي قائمة بالأوامر المفيدة لأغراض التشخيص:
show diagnostic ondemand settings
show diagnostic content location < loc >
show diagnostic result location < loc > [ test {id|id_list|all} ] [ detail ]
show diagnostic status
admin diagnostic start location < loc > test {id|id_list|test-suite}
admin diagnostic stop location < loc >
admin diagnostic ondemand action-on-failure {continue failure-count|stop}
[ no ] diagnostic monitor location < loc > test {id | test-name} [disable]
[ no ] diagnostic monitor interval location < loc > test {id | test-name} day hour:minute:second.millisec
[ no ] diagnostic monitor threshold location < loc > test {id | test-name} failure count
من البرنامج Cisco IOS XR Software، الإصدار 4.3.4 الإطار الزمني، يتم معالجة معظم المشاكل المتعلقة بفشل مسار بيانات البنية البرمجية. بالنسبة للموجهات المتأثرة بمعرف تصحيح الأخطاء من Cisco CSCuj10837 ومعرف تصحيح الأخطاء من Cisco CSCul39674، قم بتحميل SMU التي تحل محل معرف تصحيح الأخطاء من Cisco CSCul39674 لتجنب أحداث إعادة تدريب إرتباط البنية.
قام فريق النظام الأساسي بتثبيت أحدث معالجة للأخطاء بحيث يسترد الموجه في الثواني الفرعية إذا حدث فشل في أي مسار بيانات قابل للاسترداد وعند حدوث ذلك. ومع ذلك، يوصى بهذا المستند لفهم هذه المشكلة، حتى في حالة عدم ملاحظة أي خطأ من هذا القبيل.
يتتبع تطبيق التشخيص الذي يتم تنفيذه على وحدة المعالجة المركزية (CPU) لبطاقة الخط صحة كل NP مع إجراء عمليات تحقق دورية من حالة العمل ل NP. يتم حقن الحزمة من وحدة المعالجة المركزية لبطاقة الخط الموجهة إلى NP المحلي، والذي يجب أن يقوم NP بتكرار حلقته مرة أخرى والعودة إلى وحدة المعالجة المركزية لبطاقة الخط. يتم وضع علامة على أي خسارة في هذه الحزم الدورية باستخدام رسالة سجل النظام الأساسي. هنا مثال من هذا رسالة:
LC/0/7/CPU0:Aug 18 19:17:26.924 : pfm_node[182]:
%PLATFORM-PFM_DIAGS-2-LC_NP_LOOPBACK_FAILED : Set|online_diag_lc[94283]|
Line card NP loopback Test(0x2000006)|link failure mask is 0x8
تعني رسالة السجل هذه فشل هذا الاختبار في تلقي حزمة الاسترجاع من NP3. قناع فشل الارتباط هو 0x8 (تم تعيين بت 3)، وهو ما يشير إلى حدوث فشل بين وحدة المعالجة المركزية لبطاقة الخط للفتحة 7 و NP3 على الفتحة 7.
للحصول على مزيد من التفاصيل، قم بجمع مخرجات هذه الأوامر:
admin show diagnostic result location 0/
/cpu0 test 9 detail
show controllers NP counter NP<0-3> location 0/
/cpu0
تنطبق الأوامر المدرجة في هذا القسم على جميع بطاقات الخط المستندة إلى Trident بالإضافة إلى بطاقة الخط 100GE المستندة إلى الإعصار. لا يتوفر Bridge FPGA ASIC على بطاقات خطوط البيانات التي تعتمد على الأعاصير (باستثناء بطاقات خطوط شبكة إيثرنت بسرعة 100 جيجابت التي تعتمد على الأعاصير). لذا، فإن show controller fabric fia bridge
لا تنطبق الأوامر على بطاقات الخط التي تستند إلى الإعصار، باستثناء إصدارات شبكة 100GE.
يساعد هذا التمثيل التصويري على تعيين كل أمر عرض إلى الموقع في مسار البيانات. أستخدم أوامر العرض هذه لعزل حالات إسقاط الحزم والأخطاء.
المراجعة | تاريخ النشر | التعليقات |
---|---|---|
2.0 |
26-Jun-2023 |
تم تحديث قسم تحسينات الاسترداد التلقائي لمعرف تصحيح الأخطاء من Cisco CSCuc04493 وتحديث قسم الأسئلة المتداولة. |
1.0 |
29-Oct-2013 |
الإصدار الأولي |