概要
このドキュメントでは、ASR5500 Delivery Collaboration Portal(DCP)およびMIOのCapture Resource Center(CRC)エラーをトラブルシューティングする方法について説明します。
背景説明
CRCエラーが検出されると、ASR5500は自己回復と自動回復を実行するように設計されています。ほとんどの場合、内部プロセスと自動カード切り替えの非侵入的なソフトリセットを実行すると、このようなパケットの破損からシステムが回復します。
問題
ソフトエラー(CRCエラー)が検出されると、StarOSは最初にnpumgrやDDFのリロードなどの関連する内部プロセスをソフトリセットして、障害を予防的に回復しようとします。このような回復が成功しない場合、カードは自動的に再起動され、ソフトエラーがクリアされて、カードの完全なハードウェアチェックが実行されます。
DPC/UPDC/DPC2/UPC2/MIO/UMIOによってCRCエラーが検出された場合、システムが最初に実行する回復手順の1つは、該当するチップセットに関連するプロセスをソフトリセットすることです。この例では、カード8のshow logs'/syslogおよびdebug consoleのログがCRCエラーを検出し、復旧できました。
2021-Aug-01+01:01:01.711 [drvctrl 39204 error]
[8/0/7058 <hwmgr:80> hw_common_lib.c:492]
[software internal system syslog] hw_mon_elem_changed:
Detected DDF RELOAD on CRC error: card 8, device DDF1
2021-Aug-01+01:01:01.727 card 8-cpu0: [23552535.124999]
DF2 Complex-0 Program DDF2 CAF_DF1_PROG_ERR error detected on FLM123456AB
特定の状況で、プロセスの再起動でシステムが回復しない場合、DPC/UPDC/DPC2/UPC2/MIO/UMIOカードが自動的に再起動します。この例では、show logs、system syslog、および/またはdebug console logsのログを使用して、CRCエラーが検出されると、該当するカードがシステムによって自動的に再起動されます。これらのログでは、カード6が再起動され、スタンバイ状態に戻りました。
2021-Jun-20+10:11:12.150 [hat 3033 error]
[5/0/7094 <hatsystem:0> atsystem_fail.c:1470]
[hardware internal system critical-info diagnostic]
Card error detected on card 6 device DDF reason DDF_CRC_ERROR
2021-Jun-20+10:11:12.201 [rct 13013 info]
[software internal system critical-info syslog] Card 6 shutdown started
2021-Jun-20+10:11:12.201 [afctrl 186001 error]
[5/0/7169 <afctrl:0> l_msg_handler.c:277]
[software internal system critical-info syslog]
afctrl_bcf_scrmem_doorbell_callback: Slot 6 scratch memory driver error
******** show rct stats *******
RCT stats Details (Last 1 Actions)
Action Type From To Start Time Duration
----------------- --------- ---- ---- ------------------------ ----------
Shutdown N/A 6 0 2021-Jun-20+10:11:12.201 0.002 sec
解決方法
DPCおよびMIOカードで検出されるCRCエラーの大部分は、システムによって自動的に回復される一時的なエラーです。カードが正常に再起動し、サービスに戻った場合は、これ以上の操作は必要ありません。システムがこれらのエラーから自動回復できない場合、システムは3回のリセット試行後、影響を受けるデータ処理カードをオフラインにします。カードが再起動され、スタンバイ状態に戻った場合は、これ以上のアクションは必要ありません。まれに、システムがCRCから自動回復できない場合は、Cisco TACに連絡してください。