المقدمة
يصف هذا المستند تأثير عاصفة حزمة ARP على بروتوكولات مستوى التحكم مثل BFD و OSPF وغيرها، التي تعمل على محولات Nexus 7000.
تمت المساهمة من قبل نيشاد محي الدين، نيكولاي كارتاشيف، مهندسي TAC من Cisco.
س. بما أن NX-OS من Cisco يستطيع توزيع عملية BFD إلى وحدات متوافقة تدعم BFD، هل سيكون لعاصفة حزمة ARP أي تأثير على جلسات BFD على منصة Nexus 7000؟
ج. بصفة عامة، يمكن أن يكون لعاصفة حزمة ARP تأثير سلبي على إستقرار جلسات عمل BFD التي تعمل على محول Nexus 7000. وتعتمد الأعراض الدقيقة على طول وحجم حادث عاصفة حزمة ARP. أدناه نتائج إختبار من شبكة مختبر Cisco TAC.
تفاصيل إعداد المختبر
تم تصميم إعداد المختبر التالي لاختبار تأثير كميات حركة مرور ARP التي تؤثر على وحدة المعالجة المركزية (CPU) لمحول Nexus 7000.
هنا يتم إستخدام N7k-A كجهاز تحت الاختبار (DUT). DUT هو محول Nexus 7009 بتكوين الأجهزة التالي
N7k-A# show module
Mod Ports Module-Type Model Status
--- ----- ----------------------------------- ------------------ ----------
1 0 Supervisor module-1X N7K-SUP1 active *
2 0 Supervisor module-1X N7K-SUP1 ha-standby
3 32 10 Gbps Ethernet Module N7K-M132XP-12 ok
4 32 10 Gbps Ethernet Module N7K-M132XP-12 ok
N7k-A#
تحتوي N7k-A على الأجهزة التالية المتصلة بها
- N7k-B هو نظير VPC، متصل بواجهة إيثرنت 3/15
- ASR1k هو جار من الطبقة الثالثة، متصل بواجهة إيثرنت 3/14
- N7k-C هو جار من الطبقة الثالثة، متصل بواجهة إيثرنت 4/10
- مولد حركة مرور IXIA في شبكة VLAN 6، متصل بواجهة إيثرنت 3/10، والتي تم تكوينها كمنفذ وصول من الطبقة 2
لدى DUT ثلاث جلسات BFD، واحدة على بطاقة الخط في الفتحة 4 باتجاه N7k-C، واثنتان على بطاقة الخط في الفتحة 3 باتجاه N7k-B و ASR1k
N7k-A# show bfd neighbors
OurAddr NeighAddr LD/RD RH/RS Holdown(mult) State Int
10.80.6.173 10.80.6.174 1090519061/4105 Up 4951(3) Up Eth3/14
10.80.1.162 10.80.1.161 1090519054/1090519044 Up 4203(3) Up Eth4/10
10.80.1.61 10.80.1.62 1090519060/1090519059 Up 5921(3) Up Vlan6
N7k-A#
ولDUT أيضا ثلاث جلسات OSPF، واحدة على بطاقة الخط في الفتحة 4 باتجاه N7k-C، واثنتان على بطاقة الخط في الفتحة 3، نحو N7k-B و ASR1k.
N7k-A# show ip ospf neighbors
OSPF Process ID 1
Total number of neighbors: 3
Neighbor ID Pri State Up Time Address Interface
10.80.0.2 1 FULL/ - 00:13:26 10.80.1.62 Vlan6
10.80.4.25 1 FULL/DR 00:12:40 10.80.6.174 Eth3/14
10.80.0.3 1 FULL/DR 20:15:07 10.80.1.161 Eth4/10
N7k-A#
تم تسجيل OSPF مع BFD
router ospf 1
bfd
router-id 10.80.0.1
يحتوي جدول ARP على N7k-A أيضا على إدخالات لجميع جيران BFD/OSPF الثلاثة
N7k-A# show ip arp
Address Age MAC Address Interface
10.80.1.62 00:13:30 4055.390f.48c1 Vlan6
10.80.6.174 00:12:46 88f0.774b.0700 Ethernet3/14
10.80.1.161 00:15:13 6c9c.ed44.6841 Ethernet4/10
N7k-A#
بدء عاصفة ARP
يتم إستخدام مولد حركة مرور IXIA لمحاكاة جزء غير مستقر من الشبكة، مما ينتج عنه قدر كبير من حركة مرور ARP التي يتم إرسالها إلى DUT، كما هو موضح في الرسم التخطيطي أدناه
يوضح الإخراج التالي زيادة في حركة مرور الإدخال على واجهة إيثرنت 3/10، حيث يتم توصيل مولد حركة مرور IXIA. هذا بث ARP ربط يستلم في VLAN 6
N7k-A# show interface Ethernet3/10 | grep "30 seconds input rate"
30 seconds input rate 3102999976 bits/sec, 6062053 packets/sec
N7k-A#
بما أن نسخة من كل حزمة ARP للبث يتم إرسالها إلى وحدة المعالجة المركزية على N7k-A في هذا السيناريو، فإننا نشهد زيادة في وحدات البايت التي تم انتهاكها على الوحدة النمطية 3 في CoPP
N7k-A# show policy-map interface control-plane class copp-system-p-class-normal
Control Plane
service-policy input: copp-system-p-policy-strict
class-map copp-system-p-class-normal (match-any)
match access-group name copp-system-p-acl-mac-dot1x
match protocol arp
set cos 1
police cir 680 kbps , bc 250 ms
module 3 :
conformed 2295040 bytes; action: transmit
violated 20569190016 bytes; action: drop
module 4 :
conformed 128 bytes; action: transmit
violated 0 bytes; action: drop
N7k-A#
ملاحظة: لاحظ أنه لا توجد وحدات بايت منتهكة على الوحدة النمطية في الفتحة 4، نظرا لأن مصدر بث عاصفة ARP متصل بواجهة الوحدة النمطية 3 فقط
عند النقطة التي تبدأ فيها عاصفة ARP، عادة ما تكون المخرجات المذكورة أعلاه هي العلامات الأولى (والوحيدة) التي تشير إلى وجود مشكلة على الشبكة. وفي معظم الحالات، لا يتم ملاحظة هذه الإشارات أو يغفلها مشغلو الشبكة ويتقدمون بسرعة إلى وضع يؤدي إلى مشاكل كبيرة في الاتصال.
بدء عاصفة ARP في التأثير على مستوى التحكم
بشكل افتراضي، يتم تكوين قيمة مهلة ARP على النظام الأساسي Nexus 7000 لمدة 25 دقيقة أو 1500 ثانية. يجب على محول Nexus التحديث الدوري لإدخالات ذاكرة التخزين المؤقت ل ARP المحلي للحفاظ على دقة IP إلى MAC الحديثة الخاصة بالأجهزة المجاورة من الطبقة 3 للخطوة التالية.
فيما يلي إخراج جدول ذاكرة التخزين المؤقت ل ARP على DUT بعد انتهاء صلاحية إدخالات ذاكرة التخزين المؤقت ل ARP.
N7k-A# show ip arp
Address Age MAC Address Interface
10.80.1.62 00:00:06 INCOMPLETE Vlan6
10.80.6.174 00:00:10 INCOMPLETE Ethernet3/14
10.80.1.161 00:12:59 6c9c.ed44.6841 Ethernet4/10
N7k-A#
لاحظ أن إدخالات ذاكرة التخزين المؤقت ل ARP للأجهزة المتصلة ببطاقة الخط في الفتحة 3 تظهر حالة غير مكتملة، بينما يتم تحديث إدخال المحول N7k-C، المتصل ببطاقة الخط في الفتحة 4 بنجاح كما هو متوقع.
تشير رسائل سجل DUT التالية إلى التأثير على مستوى مستوى التحكم
N7k-A# show logging log
...
2016 Nov 16 22:12:55 N7k-A %BFD-5-SESSION_STATE_DOWN: BFD session 1090519060 to neighbor 10.80.1.62 on interface Vlan6 has gone down. Reason: 0x3.
2016 Nov 16 22:12:55 N7k-A %OSPF-5-ADJCHANGE: ospf-1 [10600] Nbr 10.80.1.62 on Vlan6 went DOWN
2016 Nov 16 22:12:55 N7k-A %BFD-5-SESSION_REMOVED: BFD session to neighbor 10.80.1.62 on interface Vlan6 has been removed
2016 Nov 16 22:12:56 N7k-A %OSPF-5-ADJCHANGE: ospf-1 [10600] Nbr 10.80.1.62 on Vlan6 went EXSTART
2016 Nov 16 22:13:40 N7k-A %OSPF-5-ADJCHANGE: ospf-1 [10600] Nbr 10.80.6.174 on Ethernet3/14 went DOWN
2016 Nov 16 22:13:40 N7k-A %BFD-5-SESSION_STATE_DOWN: BFD session 1090519061 to neighbor 10.80.6.174 on interface Eth3/14 has gone down. Reason: 0x3.
2016 Nov 16 22:13:40 N7k-A %OSPF-5-ADJCHANGE: ospf-1 [10600] Nbr 10.80.6.174 on Ethernet3/14 went EXSTART
2016 Nov 16 22:13:46 N7k-A %BFD-5-SESSION_REMOVED: BFD session to neighbor 10.80.6.174 on interface Eth3/14 has been removed
2016 Nov 16 22:15:45 N7k-A %OSPF-5-ADJCHANGE: ospf-1 [10600] Nbr 10.80.6.174 on Ethernet3/14 went INIT
...
N7k-A#
لاحظ في هذا الإخراج أن OSPF يتنقل بين حالة "إلى" Exstart، ثم إلى حالة "INIT". يحدث هذا لأن OSPF يستخدم البث الأحادي لتبادل البادئات أثناء حالة EXSTART. نظرا لأن تحليل ARP غير مكتمل على الوحدة النمطية في الفتحة 3 في وقت عاصفة حزمة ARP، فإن تبادل المسار لا يتم أبدا مما يؤدي إلى عدم تكوين تجاور OSPF.
ملاحظة:تعتمد دقة ARP إلى IP إلى MAC الخاصة بالخطوة التالية على البث الأحادي كما هو الحال في تشغيل BFD. نظرا لأنه يمكننا أن نستنتج أن BFD يتطلب حل ARP للتشغيل السليم.
تؤكد المخرجات التالية تأثير عاصفة حزمة ARP على كل من BFD وجلسات OSPF على الوحدة النمطية في الفتحة 3. بخلاف جلسة (جلسات) BFD و OSPF هذه على الوحدة النمطية في slot 4، فإنها ثابتة وتبقى مستقرة.
N7k-A# show bfd neighbors
OurAddr NeighAddr LD/RD RH/RS Holdown(mult) State Int
10.80.1.162 10.80.1.161 1090519054/1090519044 Up 5764(3) Up Eth4/10
N7k-A#
N7k-A# show ip ospf neighbors
OSPF Process ID 1
Total number of neighbors: 3
Neighbor ID Pri State Up Time Address Interface
10.80.0.2 1 EXSTART/ - 00:02:54 10.80.1.62 Vlan6
10.80.4.25 1 INIT/DR 00:00:05 10.80.6.174 Eth3/14
10.80.0.3 1 FULL/DR 20:29:28 10.80.1.161 Eth4/10
N7k-A#
ماذا يحدث عندما تتوقف عاصفة حزمة ARP؟
عندما تتوقف عاصفة حزمة ARP، يحدث الاسترداد التالي تلقائيا وتبدأ الشبكة في التقارب وتستمتع بالحالة المستقرة التي كانت تقوم بها قبل عاصفة بث ARP.
- يتم حل إدخالات ذاكرة التخزين المؤقت ل ARP على N7k-A
- إعادة إنشاء جلسات عمل بروتوكول BFD على الوحدة النمطية في الفتحة 3
- إعادة إنشاء جلسات عمل OSPF على الوحدة النمطية في slot 3
القرار
وعلى الرغم من أنه يمكن ل Cisco NX-OS توزيع عملية BFD على الوحدات النمطية المتوافقة التي تدعم BFD، إلا أن الكميات العالية من حركة مرور ARP التي تضرب وحدة المعالجة المركزية للمحول لفترة أطول من الوقت المتبقي لتحديث إدخالات ذاكرة تخزين ARP المحلية على النظام الأساسي Nexus 7000 سوف تتسبب في عدم الاستقرار في جلسات عمل BFD وأي بروتوكولات عميل مسجلة مع BFD.
يمكن نسب هذا إلى عملية BFD التي تتطلب تحليل ARP للخطوة التالية وهي البث الأحادي. إذا لم يتم تحديث إدخال ذاكرة التخزين المؤقت ل ARP للخطوة التالية في الوقت المناسب، ستفشل جلسة (جلسات) BFD.