概要
このドキュメントでは、デバイスが到達不能な状態にあるGSR12000デバイス(IOSまたはIOS-XRのいずれかを実行)をトラブルシューティングする手順について説明します。
前提条件
要件
GSR12000プラットフォームに関する基本的な知識があることが推奨されます。
使用するコンポーネント
このドキュメントは、Cisco 12000シリーズルータに限定されています。
このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されました。このドキュメントで使用するすべてのデバイスは、初期(デフォルト)設定の状態から起動しています。対象のネットワークが実稼働中である場合には、どのようなコマンドについても、その潜在的な影響について確実に理解しておく必要があります。
トラブルシュート
LED表示
ノードのリカバリ/デバッグを行う前に、次の表に示すようにLED情報を記録します。
SlNo |
モジュール |
info |
LEDステータス |
1 |
電源シェルフ/PEM |
PWR OK 「GREEN」 => PEMは正常です それ以外の場合は、次のいずれかのLEDがオレンジ色に点灯します FAULT、OC(過電流)、TEMP(過熱) 注:シャーシにインストールされているすべてのPEMに関する情報を収集する必要があります |
PEM1: PEM2: PEM3: PEM4: |
0 |
アラーム カード |
LED ENABLEDとFAILの2つの設定はファブリックカード(2 CSC + 3 SFC)ごとに1つ、アラームカード自体に1つの設定があります GREENは有効であることを示す AMBERはfail/empty slot |
アラーム カード: CSC0: CSC1: SFC0: SFC1: SFC2: |
3 |
ブロワー |
ステータスLEDはOKとFAILの2つの状態があります OK LEDは、ブロワが良好であることを示します FAIL LEDはブロアの問題を示す |
TOP: ボット: |
3 |
LC |
Eng3は、安定状態の間にLEDセグメント「IOX RUN」を持っています。 前面プレートのLEDが安定した状態で緑色に点灯するか、起動中またはリセット中にオレンジ色に点灯 |
スロット0 ~ スロット 15 |
4 |
RP |
アクティブACTV RPが安定した状態 スタイブSTBY RPが安定状態 コンソールイーサネットLEDの記録 |
ACTV: STBY: |
前面プレートの図
異なるLEDを示すアラームカードの前面プレート
PEMステータスLEDを示すPrivacy Enhanced Mail(PEM)前面プレート
フローチャートに基づくルータのデバッグと回復
フローチャート1
コンソール接続の詳細とターミナルサーバへのアクセスが確立されていることを確認します。
フローチャート2
コンソールアクセスが使用できない場合は、このフローチャートを使用します。
フローチャート3
コンソールアクセスが使用できず、LEDが点灯しているが、ステータスが正しくない場合は、このフローチャートを使用します。
*ディスプレイLED
- PRP:RP ACTV、RP STBY
- LC:IOS RUN(E3)/グリーンLED(E5)
- アラーム カード:緑
- ファブリック カード:緑(アラームカードのLED)
- PEM:緑色の LED
- ブロワー:緑色の LED
- アクセシビリティの断続的なチェック:
– カードの表示が変更されているかどうかを確認します。
コマンドリスト1:アクティブなRPのコンソールにアクセス可能なときに収集されるキャプチャ。
admin show platform
admin show redundancy
admin show environment power-supply
show power-mgr detail
show logging
次のコマンドを実行して、プロセスステータス、CPU使用率、パケットマネージャステータスを確認し、問題のあるプロセス(存在する場合)を特定します
セッションで提供されるコマンドを収集します。
show processes blocked
show processes cpu | ex 0%
show packet-memory summary
上記で特定したプロセスに関して、これらのログを収集します。
show processes <jid>
show processes threadname <jid>
follow jid <> iter <3>
ファブリックログ
admin show controllers fabricq drop
admin show controllers fabricq errors
admin show controllers fabricq output
admin show controllers fabricq queue
admin show controllers fabricq tofab
admin show controllers fabricq frfab
admin show controllers fabric (3 times)
show controller fia location <all slots> (3 times)
Mbusカウンタ(2 ~ 3回キャプチャ)
admin show mbus can-error location all
admin show mbus counters location all
run mtool discover
PDトレース
admin show controllers fabric trace
admin show sysldr trace all
show fiad trace
show_psarb_trace (from shell)
時間があれば、showtech(巨大なログ)を収集できます。
admin show tech-support shelf-management file <qualified disk path>
コマンドリスト2:スタンバイのコンソールのみがアクセス可能な場合に収集するログ
注:アクティブなコンソールアクセスが使用できない場合にのみログを収集し、スタンバイアクセスにアクセスできます。
手順:この手順を使用して、スタンバイのksh(shell)にアクセスし、mbusを介してアクティブkshに接続し、アクティブのシェルからログを収集します。
<esc>スタンバイコンソールからkshを実行し、<active nodeid>
カードのステータス、電源ステータス、コンソールログを知るための基本ログ
show_platform –a
envmon_show -m –p
show_logging -A
admin show logging
ファブリックドライバとQADが正常かどうかを確認するログ
fabricq_lwm_show_command -v -a
fabricq_lwm_show_command -v -t
fabricq_lwm_show_command -v -f
fabricq_lwm_show_command -v -q
fabricq_lwm_show_command -v -d
fabricq_lwm_show_command -v -r
fabricq_lwm_show_command -v -o
fabricq_lwm_show_command -v -p
fabricq_lwm_show_command -v -c
fabricq_lwm_show_command -v -p
fabricq_lwm_show_command -v -s
qad_show -b -i
mbusの問題を確認するには(2 ~ 3回収集)
mtool discover
show_mbus can-stats
show_mbus can-error
次のコマンドを実行して、プロセスのステータス、CPU使用率、およびパケットマネージャのステータスを確認し、問題のプロセス(存在する場合)を特定し、このセッションで提供されるコマンドを収集します。
show_processes -b
show_proc_cpu -c | grep -v -E 0%
packet_show summary
packet_show corrupt
Collect below set of logs for the above identified process
sysmgr_show -o -p <jid in hex>
show_processes -T -p <jid in hex>
attach_process -j <jid> -i 3
PDトレースの収集
fiad_show_ltrace
show_psarb_trace
sysldr_show_ltrace
IOSコマンドリスト:コンソールにアクセス可能なときに収集するキャプチャ。
Show logging
Show tech
Show gsr
Show monitor event-trace lci
Show monitor event-trace agent-ctrl
Show monitor event-trace board
Show monitor event-trace fab
Show gsr agent-ctrl
show gsr power-mgr details
show env power
show env internal
タイムギャップを使用して、これらのログを複数回ダンプします。
Execute-on all show controller fia
Show controller fia
Show controller errors fabric counters
Show controller errors
Show controller xbar
Show controllers sca
Show controllers clock
Show controllers csc-fpga
Show controllers fab-clk
Show mbus counters
Show mbus can