在極少數情況下,PA-A3 ATM埠介面卡上的主處理器可能會崩潰,並向控制檯列印一個「crashdump」,其輸出如下所示:
%ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump: %ATMPA-7-REG00: status 0xF040FF00, cause 0x00008018, epc 0xBFC002EC %ATMPA-7-REG01: ccc 0x03E7B620, eepc 0x00000000, apu_status 0x00015010 %ATMPA-7-REG02: edma_src 0x4B050964, edma_dest 0xA0820968, edma_cntl 0x00280000 %ATMPA-7-REG03: edma_count 0x060001E0, edma_status 0x00000000, aci_cntrl 0x44400540 %ATMPA-7-CWREG00: zero 0xBABEBABE, at 0x10000000, v0 0xBFC002EC, v1 0xF040FF00 %ATMPA-7-CWREG01: a0 0xB8000804, a1 0x08000000, a2 0x00000190, a3 0x10338530 %ATMPA-7-CWREG02: t0 0x8066B590, t1 0x00015010, t2 0x4B050964, t3 0xA0820968 %ATMPA-7-CWREG03: t4 0x060001E0, t5 0x00280000, t6 0x00000000, t7 0x44400540 %ATMPA-7-CWREG04: s0 0xC0000000, s1 0x00008001, s2 0x00000000, s3 0x00000000 %ATMPA-7-CWREG05: s4 0xB8100000, s5 0x4B01EA44, s6 0x88800000, s7 0x008002F4 %ATMPA-7-CWREG06: t8 0xF557C400, t9 0xB8000000, k0 0x00000000, k1 0xAB0DE6D4 %ATMPA-7-CWREG07: gp 0x8080309C, sp 0x8080398C, fp/s8 0xCCCCCCCD, ra 0x80801440 %ATMPA-7-MISC0: 00 0x00008001, 01 0x00000000, 02 0x00000000, 03 0xB8100000 %ATMPA-7-MISC1: 04 0x4B01EA44, 05 0x88800000, 06 0x008002F4, 07 0x00000000 %ATMPA-7-MISC2: 08 0x00000000, 09 0x00000000, 10 0x00000000, 11 0x00000000 %ATMPA-7-MISC3: 12 0x00000000, 13 0x00000000, 14 0x00000000, 15 0x00000000
本文說明如何對PA-A3上的分段和重組(SAR)崩潰進行故障排除。
本文件沒有特定需求。
本文件所述內容不限於特定軟體和硬體版本。
如需文件慣例的詳細資訊,請參閱思科技術提示慣例。
PA-A3使用稱為LSI ATMizer II的晶片來提供SAR以及其他關鍵功能。SAR的名稱顯示在show controllers atm命令的輸出中。
router# show controller atm 3/0 Interface ATM3/0 is up Hardware is ENHANCED ATM PA - DS3 (45Mbps) Lane client mac address is 0030.7b1e.9054 Framer is PMC PM7345 S/UNI-PDH, SAR is LSI ATMIZER II Firmware rev: G119, Framer rev: 1, ATMIZER II rev: 3 !--- Output suppressed.
ATMizer微碼(韌體)是一個提供特定於SAR的軟體指令的影象。Cisco 7500平台上的多功能介面處理器(VIP)IOS®和7200平台上的系統IOS包含SAR韌體,在重置後會下載到SAR。根據用於顯示ATM介面當前載入和運行的微碼版本的平台,使用以下命令:
7200系列 — show controller atm(請參閱上述輸出範例)
7500系列 — show controller vip slot# tech
PA-A3使用兩個SAR為高速OC-3和OC-12鏈路提供同時處理和傳輸所需的處理能力。
註:單一SAR對於DS-3/E-3是足夠的,但PA-A3-T3也使用兩個SAR來保持一致性。
SAR崩潰指示哪個SAR遇到問題。
%ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump: SAR0 = receive SAR1 = transmit
7xxx路由器系列支援PA-A3。7200和7500路由器使用外圍元件互連(PCI)匯流排作為埠介面卡和「主機」記憶體之間的資料路徑。主機記憶體是VIP上的本地SRAM或7200的網路處理引擎(NPE)上的SRAM。
此圖說明VIP2的架構和PCI匯流排的位置:
SAR提供與PCI匯流排的連線,以便傳輸到資料包記憶體。它還為ATM信元處理提供SAR功能,並為外部線路提供PHY或物理介面。
我們可以根據碰撞原因將SAR碰撞分為幾個類別。只要發現不可恢復的錯誤,SAR就會崩潰。這些錯誤可能是軟體或硬體造成的。要確定原因,請參考crashdump輸出的第二行中顯示的原因暫存器。異常代碼記錄在原因暫存器值的二到六位中。從最右側的位作為零位開始。例如:
%ATMPA-7-REG00: status 0xF040FF10, cause 0x00004018, epc 0x80802F68
將十六進位制值0x00004018轉換為二進位制。請注意,每個十六進位制值代表四位。本例中的二進位制等效項為4 = 0100,0 = 0000,1 =0001,8 = 10000,然後0x00004018 = 0100 000 000 0001 1000。
從右到左計數,找到位2到6。在我們的示例中,位2到位6等於00110
將這5位轉換為十六進位制。在本例中,00110轉換為0x06。
請參閱異常代碼表。在示例中,SAR響應輔助匯流排錯誤異常而崩潰。
例外代碼 | 說明 | 可能的原因 |
0x00 | 中斷 | 中斷條件已確定。 |
0x01 | TLB修改異常 | |
0x02 | TLB異常(載入/提取) | |
0x03 | TLB異常(儲存) | |
0x04 | 地址錯誤(載入/獲取) | 未對齊的地址(軟體)。 |
0x05 | 地址錯誤(儲存) | 未對齊的地址(軟體)。 |
0x06 | 匯流排錯誤 | 匯流排超時、奇偶校驗錯誤等(硬體)。 |
0x07 | 保留 | |
0x08 | Syscall | 嘗試執行SYSCALL指令。 |
0x09 | 斷點 | 嘗試執行BREAK指令。 |
0x0a | 保留指令 | 嘗試執行無效指令。 |
0x0b | 協處理器不可用 | 嘗試在不可用的協處理器上執行。 |
0x0c | 算術溢位 | |
0x0d | 陷阱 | |
0x0e | 保留 | |
0x0f | 浮點 | 嘗試訪問非現有FPU。 |
0x10-1f | 保留 |
當任何值原因暫存器將位15設定為1時,SAR崩潰的原因是由於硬體造成的PCI中止或奇偶校驗錯誤。具體來說,原因暫存器將顯示在crashdump中,如下所示:
cause 0x00008000
通過更換ATM埠介面卡來排除此原因值的故障。如果問題仍然存在,請更換多功能介面處理器(VIP)(如果使用7500系列路由器),或更換網路處理引擎(NPE)/網路服務引擎(NSE)(如果使用7200或7400系列路由器)。
思科錯誤ID CSCdr09895可防止將重複的故障轉儲列印到控制檯,因為只有第一個故障轉儲與故障排除相關。以下錯誤ID可解決導致SAR崩潰的罕見情況。請使用Bug工具包(僅供註冊客戶使用)確定您的Cisco IOS軟體版本是否受這些錯誤ID影響。
思科錯誤 ID | 說明 |
CSCdp62791 | 通過在未配置的VC上不向SAR傳送資料包或使用無效封裝向SAR傳送資料包,防止SAR1崩潰。 注意:儘管報告不同的症狀,但CSCdp01166會重複到,並通過CSCdp62791修復。 |
CSCdp42529 | 防止由於接收傳輸SAR上不存在的VPI/VCI對上的信元而導致的SAR1崩潰。當建立或拆除大量SVC時,可能會發生此問題,因此傳輸SAR遺漏來自VIP或NPE上的主機CPU的命令中斷。發生這種情況時,只在接收SAR上定義VC,並且如果在未定義的VPI/VCI對上接收OAM環回或資源管理信元,則傳輸SAR崩潰。 |
CSCdr09895 | 防止在傳輸流量繁重時,SAR嘗試訪問輔助記憶體中的非法地址(儲存等待分段和重組的資料包)時發生的SAR0崩潰。這種情況稱為匯流排錯誤。 |
CSCdp64588 | 防止路由器由於重複的SAR(0或1)崩潰而崩潰。當SAR崩潰時,PCI主機驅動程式(提供PA-A3和路由器中PCI匯流排之間的介面)嘗試再次啟動PA。如果出現重複的SAR崩潰,並且PA不響應主機驅動程式,則主機驅動程式會嘗試關閉(關閉)PA,並且PA會關閉。在某些情況下,如果SAR崩潰,並且主機驅動程式已清除與此PA相關的記憶體,則路由器會由於匯流排錯誤而崩潰。 |
以下要點總結如何對PA-A3 ATM埠介面卡上的SAR崩潰進行故障排除:
確定SAR0(接收SAR)還是SAR1(傳輸SAR)崩潰。爆裂坑的第一行會告訴你。
%ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump
使用異常代碼表對crashdump輸出中的原因暫存器值進行解碼。
如果原因暫存器是位15設定為1的值,請更換硬體。
如果原因暫存器是任何其他值,請收集下列思科技術支援資訊:
crashdump輸出
show controller atm(7200系列)
show controller vip slot#tech(7500系列)
show tech-support
認真考慮安裝您當前運行的Cisco IOS軟體系列的最新維護版本。
修訂 | 發佈日期 | 意見 |
---|---|---|
1.0 |
10-Sep-2018 |
初始版本 |