概要
このドキュメントでは、アグリゲーションサービスルータ(ASR)903(ASR903)で一般的に発生するハードウェア障害の症状とそのトラブルシューティング方法を分析する方法について説明します。
前提条件
要件
次の項目に関する基本的な知識が推奨されます。
- Cisco IOS XE ソフトウェア
- ASR 903 CLI
使用するコンポーネント
このドキュメントの情報は、障害の症状が観察された特定のラボ環境のデバイスから作成されたものです。このドキュメントで使用するすべてのデバイスは、初期(デフォルト)設定の状態から起動しています。稼働中のネットワークで作業を行う場合、コマンドの影響について十分に理解したうえで作業してください。
概要
Cisco ASR 903ルータは、モバイルおよびビジネスサービスの統合をコスト効率よく実現するフル機能のアグリゲーションプラットフォームです。奥行きが浅く、消費電力が低く、拡張温度範囲が広いため、高いサービススケール、冗長性、柔軟なハードウェア構成がでCisco ASR 9ASR 900003 IP無線アクセスネットワーク(RAN)ネットワークの事前集約ルータ、またはキャリアイーサネットネットワークの集約ルータ。
このプラットフォームは、次の図に示す主要な現場交換可能ユニット(FRU)で構成されています。
ラベル |
コンポーネント |
1 |
インターフェイスモジュール(IM) |
0 |
2つのルートスイッチプロセッサ(RSP)ユニットスロット。RSP1A-55、RSP1B-55、RSP2A-64、およびRSP2A-128をサポート |
3 |
ファン トレイ |
4 |
冗長DC電源ユニット |
通常の動作時には、フィールド交換可能ユニット(FRU)のいずれかが障害の症状を示す可能性があります。これは、ハードウェア障害とは限らないハードウェアコンポーネントの交換に終わることがよくあります。特定のトラブルシューティング手法に従うことで、これらのモジュールを障害状態から回復し、ネットワークのダウンタイムを短縮できます。
トラブルシュート
DC電源(A900-PWR550-D)で障害が報告
- マルチメーターを使用してDC PSU(電源装置)コネクタの入力DC電圧を測定し、電源を確認します。値は24V ~ 60Vの範囲である必要があります。
- 入力電圧の読み取りがOKの場合は、パネルのLEDのステータス(「Input Ok」および「Output Fail」)を確認します。 両方のLEDがオフの場合は、DC PSUを交換します。
- 「Input OK」LEDが緑色で、「output Fail」LEDがオレンジまたは赤色の場合は、まず入力電源コネクタを取り外してから、完全なDC PSUをジャックします。15秒間待ちます。DC PSUを挿入し直し、入力電源コネクタを接続します。この演習は、両方のDC PSU(システムに2つのDC PSUがある場合)に行う必要があります。
- 「Input OK」LEDが緑色で、「output FAIL」LEDがまったく点灯しない場合は、DC PSUを交換します。
注:ルータは単一の電源で動作可能です。電源がオンになっていない場合は、セカンダリ電源装置を物理的に挿入する必要があります。
ファントレイで障害が報告される
Cisco ASR 903ルータは、電源装置とは別のモジュラファントレイを使用します。ファントレイには12個のファンがあり、ファンに障害が発生しても動作を維持するのに十分な容量を提供します。ファントレイモジュール(A903-FANおよびA903-FAN-E)には、ルータが使用されている環境に応じて2種類あります。後者(A903-FAN-E)には8mmのファンダストフィルタが付属し、ユニットへのゴミの侵入を防止し、部品の損傷を防止します。
シナリオ 1:トレイの個々のファンモジュールに障害が発生しました
show platformコマンドまたはshow facility-alarm statusコマンドを使用して、トレイのファンのステータスを確認します。ファンに障害が発生した場合、ファントレイのステータスは、障害が発生した個々のユニットの詳細とともに「障害」として表示されます。
ASR903#
show platform | in FAN|State
Chassis type: ASR-903
Slot Type State Insert time (ago)
P2 A903-FAN-E
f2, f4, f6, fail
05:00:00
[an error occurred while processing this directive]
ASR903#
sh facility-alarm status
System Totals Critical: 1 Major: 3 Minor: 0
Source Severity Description [Index]
Fan Tray CRITICAL Multiple Fan Failures [2]
Fan Tray MAJOR Fan 2 Failure [5]
Fan Tray MAJOR Fan 4 Failure [7]
Fan Tray MAJOR Fan 6 Failure [9]
[an error occurred while processing this directive]
これらの出力は、スロットf2、f4、およびf6のファンモジュールに障害が発生し、交換が必要であることを示しています。
シナリオ 2:ファントレイが「不明」として報告される
場合によっては、「show platform」出力でファントレイが「Unknown」と表示され、Network Management System(NMS)ステーションでもアラームが生成されることがあります。
ASR903#
sh platform | in P2
Chassis type: ASR-903
Slot Type State Insert Time (ago)
P2 Unknown N/A never
[an error occurred while processing this directive]
モジュールの回復に役立つ次の手順を実行します。
- FANモジュールを物理的に取り付け直します。ファントレイの取り外しまたは交換後、システムの再初期化に2分以上かかります。モデル「A903-FAN-E」をダストフィルタで使用している場合は、フィルタをクリーニングしてFANモジュールが詰まらないようにしてください。
- ルータの電源を再投入し、ファントレイが検出されているかどうかを確認します。
- ファントレイで「unknown」と報告されている場合は、この問題を解決するために交換が必要になることがあります。
注:既知の外観上の不具合があります。このはCSCuu75796に記載されており、ファントレイは不明として報告されます。誤った障害メッセージを回避するには、ファントレイの取り外しまたは交換後にシステムが再初期化されるまで、少なくとも2分間かかります。
RSPによって報告される障害
シナリオ1:RSPが不明として報告される
ASR903#
show platform | in R1
Chassis type: ASR-903
Slot Type State Insert Time (ago)
R1 A903-RSP1B-55 unknown 1d01h
[an error occurred while processing this directive]
- コマンド「hw-module slot R1 reload」を実行し、プロセッサが初期化されているかどうかを確認します。
- スタンバイRSPが「init,standby」状態に移行せずに「booting」状態と「unknown」状態に切り替わる場合、問題のほとんどはローカルブートフラッシュにIOS-XEイメージがないことが原因です。
- USBフラッシュドライブを有効なIOS-XEイメージとともに使用して、RSPを起動します。モジュールが「不明」状態が続く場合は、モジュールの物理的な抜き差しを実行します。
- 上記の手順がすべて失敗した場合は、RSPモジュールからコンソールログを収集し、TACでサービスリクエストをオープンします。
シナリオ2:スタンバイRSPが「booting」状態と「init,standby」状態を切り替える
スタンバイRSPモジュールでこの動作が発生する一般的な理由の1つは、アクティブRSPとスタンバイRSPの間の設定同期障害が原因です。これを確認するには、次のコマンドを実行する必要があります。
ASR903#show redundancy config-sync failures bem
ASR903#show redundancy config-sync failures mcl
ASR903#show redundancy config-sync failures prc
[an error occurred while processing this directive]
上記のいずれかのコマンドで障害が報告された場合は、次の回避策を実装して、RSPがUP状態を維持しているかどうかを確認します。
ASR903# config terminal
ASR903config)#redundancy
ASR903(config)#mode sso
ASR903(config-red)#no policy config-sync lbl prc reload
ASR903config-red)#no policy config-sync bulk prc reload
ASR903(config-red)#end
[an error occurred while processing this directive]
RSPモジュールが引き続きブートループのままになる場合は、次に示すように、デバイスログにリンクエラーがないかどうかを確認します。RSPモジュールに問題がなければ、物理的な取り付け直しによって問題が解決しない場合は、RSPモジュールを交換する必要があります。
%IOSXE-3-PLATFORM: R0/0: kernel: pciehp 0000:02:07.0:pcie24: Link Training Error occurs
%IOSXE-3-PLATFORM: R0/0: kernel: pciehp 0000:02:07.0:pcie24: Failed to check link status
[an error occurred while processing this directive]
インターフェイスモジュール(IM)の初期化に失敗する
モジュールがインストールされると、IMは特定の状態(out of service->inserted->booting->OK)に遷移します。 6つの使用可能なスロットのいずれかで、ブートステートを過ぎてもインターフェイスモジュール(IM)が故障した場合は、次の手順を実行します。
ASR903#sh platform
Chassis type: ASR-903
Slot Type State Insert Time (ago)
0/4 A900-IMA8S inserted/unkown 00:27:02 (physical)
[an error occurred while processing this directive]
- コマンド「hw-module subslot <slot/subslot> reload」を使用して、該当するモジュールをリロードします。モジュールが回復したかどうかを確認します。
ASR903#hw-module subslot 0/1 reload
Proceed with reload of module? [confirm]
%IOSXE_OIR-6-SOFT_RELOADSPA: SPA(A900-IMA1X) reloaded on subslot 0/1
[an error occurred while processing this directive]
- 同じスロットにモジュールを物理的に取り付け直します。モジュールが「不明」のままである場合は、別のスロットに挿入して、シャーシの不良ラインカードスロットを除外してください。
- ログを確認し、次に示すカーネル/リンクエラーを確認します。
%IOSXE-3-PLATFORM: R0/0: kernel:pciehp 0000:02:07.0:pcie24: Link Training Error occurs
%IOSXE-3-PLATFORM: R0/0: kernel:pciehp 0000:02:07.0:pcie24: Failed to check link status
[an error occurred while processing this directive] 「リンクトレーニング」エラーは、基本的に、特定のスロットのPeripheral Component Interconnect Express(PCIe)バスに通信エラーがあることを意味します。PCIeホットプラグモジュールは、RSPエンジンでホストされます。モジュールがスタンバイRSP(Route-Switch Processor)のPCIeバスに登録されるように、RSPスイッチオーバーを実行します。 スイッチオーバー後にモジュールが回復した場合は、以前のアクティブなRSPモジュールを交換する必要があります。
ASR903#redundancy force-switchover
Proceed with switchover to standby RP? [confirm]
[an error occurred while processing this directive]
注:さらにサポートが必要な場合は、Cisco Technical Assistance Center(TAC)でサービスリクエストをオープンし、トラブルシューティングの詳細とルータからの「show tech-support」出力を確認してください。