簡介
本文檔介紹了與拓撲獨立(TI) -無環替代(LFA)融合的概念,這是一種高度集中的功能。本章詳細說明了分段路由(SR) -流量工程(TE)策略路徑收斂的機制,以TI-LFA保護為底層根據XYZ網路的要求畫出拓撲圖。
鏈路故障檢測
請注意,SR-TE策略路徑收斂和TI-LFA功能彼此獨立,並分別運行。但是,增加TI-LFA功能可以快速檢測主SR-TE策略路徑故障以及在理想網路條件下切換到預定義備份路徑的流量小於50毫秒。SR-TE策略在沒有TI-LFA的情況下可以完美地運行,但是,在該場景中,收斂數字將完全取決於內部網關協定(IGP),並且會遠遠高於50毫秒。
在鏈路故障情況下,我們的目標是儘可能縮短收斂時間,從而最大程度地減少鏈路斷開/抖動事件期間的資料包丟失。
主要可透過以下方法檢測頭端節點上的鏈路斷開事件:
1. 在物理層進行相鄰鏈路斷開檢測。
2. 在遠端鏈路中斷的情況下,透過捆綁包進行BFD檢測。
在第一種情況下,檢測速度更快,收斂時間比第二種情況要短,因為檢測取決於配置的BFD間隔/Dead計時器和鏈路斷開的確切網路點。但是,非常快速的檢測並不一定意味著快速收斂,因為XYZ組織網路是一種多層結構,其端到端服務流量涵蓋多個躍點。
由於XYZ Org網路包含在單個BGP AS和單個IGP域中,因此TI-LFA預定義的備份路徑會在所有場景中的鏈路故障後立即傳輸故障切換流量,並確保無論拓撲狀態如何,資料包丟失率都降至最低,字首覆蓋完全覆蓋。由於IGP,SR-TE策略定義的主路徑/輔助路徑可能需要一些時間才能收斂,並最終接管核心中的端到端服務流量,這些流量可能與TI-LFA的預定義路徑匹配,也可能不匹配。
詳細的融合方案
有關更多詳細資訊,讓我們瞭解此處詳細介紹的示例,該示例解釋使用SR-TE策略和TI-LFA作為XYZ Org網路的收斂機制的流量路徑。
與拓撲圖一致的SR配置示例:
segment-routing
traffic-eng
!
!
segment-list PrimaryPath1
index 10 mpls adjacency 10.1.11.0 --> First Hop (P1 node) of the explicit-path
index 20 mpls adjacency 10.1.3.1 --> Second Hop (P3 node) of the explicit-path
index 30 mpls adjacency 10.3.13.1 --> Third Hop (PE3 node) of the explicit-path
!
policy POL1
source-address ipv4 11.11.11.11 --> Source Node of the explicit-path
color 10 end-point ipv4 33.33.33.33 --> Destination Node of the explicit-path
candidate-paths
preference 100 --> Secondary Path taken care of dynamically by IGP TI-LFA
dynamic
metric
type igp
!
!
!
preference 200
explicit segment-list PrimaryPath1 --> Primary Explicit-Path of the SR-TE policy
!
!
在正常情況下,資料流必須透過SR-TE策略PE1 > P1 > P3 > PE3
和PE1 > P2 > P4 > PE3
兩個可能的候選路徑中的一個(管理員使用鄰接(Adj) -段識別符號(SID)清單配置的主顯式路徑10.1.11.0, 10.1.3.1, 10.3.13.1
或相關IGP確定的輔助動態路徑)從PE1流向PE3。管理員傾向於使用主要候選路徑,並且僅在主要路徑發生故障時回退到輔助路徑。因此,會為表示偏好路徑的主要候選路徑指定較高的偏好設定值。例如,主要候選路徑的優先順序為200
,而輔助候選路徑的優先順序為100
。
圖1:正常流量方案SR-TE主要候選路徑
當候選路徑有效時,將使用任何候選路徑,其組成SID的可達性決定了有效性條件。
當兩個候選路徑都有效且可用時,頭端PE1選擇更高優先路徑並將此路徑的SID清單安裝到其轉發表中 10.1.11.0, 10.1.3.1, 10.3.13.1
。在任何時間點,導向此SR策略的服務流量僅會在所選路徑上傳送,任何其他動態候選路徑都處於非活動狀態。
當候選路徑在SR策略的所有有效候選路徑中擁有最高的優先順序值時,會選取該候選路徑。選擇的路徑也稱為SR原則的「作用中路徑」。
連結失敗收斂-主要路徑會進入關閉狀態
在某個時刻,網路中可能會出現鏈路故障。故障鏈路可以是任意兩個節點(例如P1和P3)之間的鏈路。一旦透過本節開頭所述的任何方法檢測到故障,TI-LFA保護必須確保流量被快速重定向到TI-LFA保護路徑,最好在50毫秒內。
請注意,在此場景中,圖2所示的TI-LFA確定的備份路徑與圖3中IGP確定的最終融合備份策略路徑不同。這是相當正常的,因為Ti-LFA備份路徑由發生故障的本地修復點(PLR)節點本地確定,但是,最佳化的SR-TE策略備份路徑由持有SR-TE策略決策的前端節點的IGP收斂確定。
圖2:透過TI-LFA備份路徑的故障轉移流量方案
流量繼續流經TI-LFA保護路徑,直到最後,頭端PE1透過IGP泛洪得知故障鏈路的SID10.1.3.1
變得無效。然後,PE1評估路徑的SID清單10.1.11.0, 10.1.3.1, 10.3.13.1
的有效性,並由於SID 10.1.3.1
無效而使其無效。同時,它將使候選路徑失效,並重新執行SR-TE策略的路徑選擇過程。然後,PE1選擇具有下一個最高首選項值的另一個有效候選路徑,並將新輔助候選路徑10.2.11.0, 10.2.4.1, 10.4.13.1
的SID清單安裝到轉發表中。但是,此次要候選路徑在本質上是動態的,由IGP開放最短路徑優先(OSPF)決定,沒有管理控制。在此步驟之前,流量流經受保護的TI-LFA路徑;但在此步驟之後,流量被引導到SR-TE策略的新首選輔助路徑。
圖3:透過SR-TE輔助候選路徑的故障轉移流量方案
摘要步驟:
1. 在失敗點上:
- 第1層/BFD向主路徑下發訊號至FIB
- FIB將使用TI-LFA建立的備份路徑推送到硬體
- 預期的流量中斷:
- 鏈路中斷:約50毫秒
- BFD對等丟失:BFD失效時間+ ―50毫秒
- 丟失鏈路上的OSPF對等斷開
2. 域中的所有OSPF路由器透過鏈路狀態通告(LSA)泛洪獲知SID丟失
3. 在SR-TE頭端PE1上:
- OSPF收斂
- SR-TE策略主路徑SID清單無效
- 主要適用者的路徑會中斷
- 輔助候選路徑SID清單已驗證,並且處於活動狀態
- 流量透過輔助路徑傳送,不會丟失任何服務流量
鏈路故障重新收斂-主路徑恢復運行狀態
同時,一旦主失效鏈路被恢復,具有優先順序的原始主路徑(200)再次變為有效,因此頭端PE1執行SR-TE策略路徑選擇過程,選擇具有最高優先順序的有效顯式候選路徑,並使用原始主路徑的SID清單更新其轉發表。導向到此SR原則的服務流量會從原始路徑PE1 > P1 > P3 > PE3
再次傳送。
圖4:重新融合流量方案
摘要步驟:
1. 第1層/BFD向主路徑傳送備份訊號,並通知OSPF。
2. 流量仍然透過SR-TE策略備用候選路徑轉發。
3. 一段時間後,SR-TE策略主候選路徑的SID清單透過OSPF LSA泛洪有效。
4. 流量從SR-TE策略備份候選路徑切換到SR-TE策略主候選路徑,且流量不丟失。
總之,這些場景提供了收斂過程和理想收斂數的理論解釋;但是,您需要測試實驗中的實際收斂數,以便儘可能地模擬生產網路和配置,並在網路中觸發可以預見的不同故障點。
注意:請注意,本文檔僅說明鏈路保護方案,因為如果定義的顯式路徑與中間節點接觸,則節點保護不適用於SR-TE顯式路徑。這是因為TI-LFA將每個已配置的中間跳作為目的節點,並且在任何這些故障發生時,都無法解析最終目的。這是技術限制,不限於任何平台或映像版本。此限制的解決方案已在本文檔的第2部分討論,如相關資訊部分中所述。
使用的軟體
用於測試和驗證解決方案的軟體是Cisco IOS® XR 7.3.2。
相關資訊