この製品のマニュアルセットは、偏向のない言語を使用するように配慮されています。このマニュアルセットでの偏向のない言語とは、年齢、障害、性別、人種的アイデンティティ、民族的アイデンティティ、性的指向、社会経済的地位、およびインターセクショナリティに基づく差別を意味しない言語として定義されています。製品ソフトウェアのユーザーインターフェイスにハードコードされている言語、RFP のドキュメントに基づいて使用されている言語、または参照されているサードパーティ製品で使用されている言語によりドキュメントに例外が存在する場合があります。シスコのインクルーシブランゲージに対する取り組みの詳細は、こちらをご覧ください。
シスコは世界中のユーザにそれぞれの言語でサポート コンテンツを提供するために、機械と人による翻訳を組み合わせて、本ドキュメントを翻訳しています。ただし、最高度の機械翻訳であっても、専門家による翻訳のような正確性は確保されません。シスコは、これら翻訳の正確性について法的責任を負いません。原典である英語版(リンクからアクセス可能)もあわせて参照することを推奨します。
実際には正常に機能しているハードウェアを交換することで、貴重な時間とリソースが無駄になることがよくあります。このドキュメントでは、Cisco 12000 シリーズ インターネット ルータのハードウェアに関する一般的な問題のトラブルシューティングに役立つ情報と、故障がハードウェアに関するものかどうかを識別するための手がかりとなる情報を提供します。
注:このドキュメントは、ハードウェアの問題と誤認されやすい問題を除き、ソフトウェア関連の障害は取り上げていません。
注:また、この文書では、Cisco 12000 シリーズ line card(LC; ライン カード)に関するハードウェアのトラブルシューティングは対象としていません。 「Cisco 12000 シリーズ インターネット ルータ ラインカード障害のハードウェア トラブルシューティング」では、ラインカードに関するハードウェアの問題のトラブルシューティング手順と、ハードウェアの障害と誤解されることのある問題を識別する手順について、詳細に説明しています。
この文書を読むには、次の知識が必要です。
『Cisco 12000 シリーズ インターネット ルータの既知の問題』の「Cisco 12000 シリーズ インターネット ルータのハードウェアに関する既知の問題」
発生した問題がハードウェア障害と関係があると思われる場合には、この資料を参考にして、障害の原因を明らかにしてください。
このドキュメントの情報は、次のソフトウェアとハードウェアのバージョンに基づくものです。
すべての Cisco 12000 シリーズ インターネット ルータ。12008、12012、12016、12404、12406、12410、および 12416。
Cisco 12000 シリーズ インターネット ルータをサポートするすべての Cisco IOS(R) ソフトウェア バージョン。
このマニュアルの情報は、特定のラボ環境に置かれたデバイスに基づいて作成されました。このドキュメントで使用するすべてのデバイスは、初期(デフォルト)設定の状態から起動しています。実稼動中のネットワークで作業をしている場合、実際にコマンドを使用する前に、その潜在的な影響について理解しておく必要があります。
新しいラインカードやモジュールを取り付けたり、Cisco IOS(R) ソフトウェア イメージをインストールする場合には、ルータに十分なメモリがあることや、そのハードウェアやソフトウェアと使用する機能との間に互換性があることを確認する必要があります。
次の推奨手順を実行して、ハードウェアとソフトウェアの互換性とメモリ要件を確認してください。
Software Research(登録ユーザ専用)ツールを使用して、ネットワークデバイスのソフトウェアを選択します。
ヒント:
「ハードウェアのソフトウェアサポート」セクションでは、ルータに取り付けられているモジュールとカードが、目的のCisco IOSソフトウェアバージョンでサポートされているかどうかを確認できます。
「機能のソフトウェアサポート」セクションでは、実装する機能のタイプを選択して、必要なCisco IOSソフトウェアイメージを判別できます。
Cisco IOSソフトウェアに必要な最小メモリ量(RAMおよびフラッシュ)を確認するか、Cisco IOSソフトウェアイメージをダウンロードする場合は、「ソフトウェアダウンロードエリア」を使用してください。ルータに取り付けるメモリの量(RAM およびフラッシュ)を判断するには、「Cisco IOS ソフトウェア リリースの選択方法」の「メモリ要件」セクションを参照してください。
ヒント:
ルータで現在実行されているバージョンと同じ機能を保持するが、使用している機能セットがわからない場合は、シスコデバイスからshow versionコマンドを入力し、Cisco CLIアナライザに貼り付けます。Cisco CLI Analyzerを使用して、潜在的な問題と修正を表示できます。Cisco CLI Analyzer を使用するには、登録ユーザとしてログインする必要があり、また、JavaScript を有効にする必要があります。特に最新のソフトウェア機能を使用しようとする場合は、機能サポートについて確認することが重要です。
Cisco IOS ソフトウェア イメージを新しいバージョンまたは機能セットにアップグレードする必要がある場合、詳細は、『Cisco IOS ソフトウェア リリースの選択方法』を参照してください。
Cisco IOS ソフトウェアのアップグレードが必要と判断された場合には、Cisco 12000 シリーズ ルータに関する「ソフトウェア インストールおよびアップグレード手順」に従ってください。
ヒント:ROMmon(rommon # >プロンプト)でスタックしたCisco 12000シリーズルータを回復する方法については、「Cisco 12000のROMmon回復手順」を参照してください。
ドキュメント表記の詳細は、『シスコ テクニカル ティップスの表記法』を参照してください。
Cisco 12000 シリーズ インターネット ルータのシャーシを構成するコンポーネントは、次のとおりです。
シャーシ
スイッチ ファブリック カード(SFC)
クロック スケジューラ カード(CSC)
メンテナンス バス(MBUS)
電源モジュール
ブロワー : ファン アセンブリ
アラーム カード
シャーシ自体には電子部品は組み込まれていないので、バックプレーン コネクタが部分的に曲がっていたり破損していないかぎり、シャーシがハードウェア関連の問題の原因になることはほとんどありません。電源装置、SFC、CSC、アラーム カード、およびファン アセンブリには、いずれも電子部品が組み込まれているので、これらはハードウェア問題の影響を受けることがあります。一般に、これらのコンポーネントでハードウェア上の問題が発生すると、エラー メッセージが出力されるか、またはルータの機能に障害が起きます。これらのすべてのコンポーネントに関する詳細な説明と、相互運用の仕組みについては、「Cisco 12000 シリーズ インターネット ルータのアーキテクチャ」を参照してください。
ここでは、ルータに発生した問題がハードウェアに関係しているかどうかを判断するためのトラブルシューティング手順を説明します。
最初に行う必要があるのは、ルータのクラッシュの原因、または表示されているコンソール エラーの原因を明らかにすることです。故障している箇所を調べるには、次のコマンドによる出力を収集することが不可欠です。
show context summary
show logging
これらの show コマンドのほかに、次の情報も収集する必要があります。
コンソール ログと syslog 情報:複数の症状が見られる場合に根本の原因を判別するには、これらが必須の情報になります。ルータが syslog サーバにログを送信するよう設定されていれば、問題が発生したときの情報を確認できる可能性があります。コンソール ログの場合は、ルータのコンソール ポートに直接接続して logging enabled を使用するのが最もよい方法です。
show technical-support:show technical-support コマンドは、show version、show running-config、show stacks などの複数のコマンドを 1 つにまとめたものです。通常、ルータで問題が発生したときには、シスコ Technical Assistance Center(TAC)エンジニアからこの情報の提供を求められます。ルータのリロードまたは電源のオフ/オンを行うと、問題に関する情報がすべて失われてしまうため、show technical-support は必ずリロードまたは電源のオフ/オンを行う前に実行してください。
実際にはハードウェア障害ではないにもかかわらず、ハードウェア障害と間違われやすい現象がいくつかあります。代表的なものは、ルータが応答しなくなる、すなわち「ハング」するという問題です。 また、新しいハードウェアを取り付けたあとによく起こる問題もあります。シャーシのコンポーネントが原因で、これらの症状が起きるということは、まずありません。次の表に、誤解を招きやすい問題についての症状、説明、およびトラブルシューティング ステップを示します。
症状 | 説明/トラブルシューティング |
---|---|
Cisco 12000 が通常動作中にハングする | この症状は、一般にソフトウェアの問題が原因で発生しますが、ハードウェアが原因の場合もあります。この問題については、「トラブルシューティング:ルータがハングする場合」を参照してください。 |
新しいライン カードが認識されない | Software Research(登録ユーザ専用)ツールを使用して、新しいカードが現在のCisco IOSソフトウェアバージョンでサポートされているかどうかを確認します。LC がサポートされている場合は、service upgrade all を設定し、copy run start コマンドで設定を保存して、ルータの電源をオフ/オンします。リロードでは不十分なときもありますが、このときは電源のオフ/オンによって解決します。現在使用中の Cisco IOS ソフトウェア バージョンで新しいカードがサポートされていない場合は、ラインカードに十分なルート メモリがあることを確認してから、Cisco IOS ソフトウェアのバージョンをアップグレードします。リリース 12.0(21)S の場合、特に Border Gateway Protocol(BGP; ボーダーゲートウェイ プロトコル)で多数のピアと多数のルートが設定されている場合は、256 MB のルート メモリが必要です。 |
CPU 使用率が非常に高い | この症状については、ハードウェアの問題が原因である場合もありますが、それ以上に、ルータの設定に誤りがあるか、またはネットワーク上の何かが問題を引き起こしている可能性があります。この症状をトラブルシューティングするには、「トラブルシューティング:Cisco ルータで CPU 高使用率が発生した場合」を参照してください。 |
ハードウェアの問題が原因でメモリ割り当てエラーが起こることはほとんどありません。 | |
show interfaces コマンドの出力で、入力廃棄の数が増えている | この問題は、ルータのハードウェアが原因で発生することはありません。この問題のトラブルシューティングについては、「トラブルシューティング:Cisco 12000 シリーズ インターネット ルータでの入力廃棄」を参照してください。 |
show interfaces コマンドの出力で ignored メッセージの数が増えている | いずれかのラインカードで過負荷が起きていると思われます。「トラブルシューティング:Cisco 12000 シリーズ インターネット ルータでの ignored エラーとメモリ不足による廃棄」に詳細に記載されている手順に従ってください。 |
GRP 上で Forwarding Information Base(FIB; 転送情報ベース)関連のエラー メッセージが発生する | エラーメッセージデコーダ(登録ユーザのみ)ツールを使用して、このエラー メッセージの意味に関する情報を参照してください。一部は、ラインカードまたはスイッチファブリックカード(SFCまたはCSC)のハードウェアの問題を示しています。その他は、Cisco IOSソフトウェアの不具合またはルータの別の部分のハードウェアの問題を示しています。FIB および CEF に関連するメッセージの一部が「トラブルシューティング:CEF 関連のエラー メッセージ」で説明されています。 |
GRP 上で Inter Process-Communication(IPC;プロセス間通信)関連のメッセージが発生する | エラーメッセージデコーダ(登録ユーザのみ)ツールを使用して、このエラー メッセージの意味に関する情報を参照してください。一部は、ラインカードまたはスイッチファブリックカード(SFCまたはCSC)のハードウェアの問題を示しています。その他は、Cisco IOSソフトウェアの不具合またはルータの別の部分のハードウェアの問題を示しています。IPC関連のメッセージの一部については、「Cisco 12000、10000、7600、および7500シリーズルータ:IPC-3-NOBUFFメッセージのトラブルシューティング』を参照してください。 |
GRP上で次のエラー メッセージが発生する %GRP-3-FABRIC_UNI: Unicast send timed out (1) %GRP-3-COREDUMP: Core dump incident on slot 1, error: Fabric ping failure |
ラインカードまたはセカンダリ GRP が、スイッチ ファブリックを介してプライマリ GRP からのファブリック Ping 要求に応答できなかった場合、ファブリック Ping 障害が発生します。こうした障害の症状が出ると、調査が必要です。この問題の詳細は、「トラブルシューティング:Cisco 12000 シリーズ インターネット ルータにおけるファブリック Ping のタイムアウトおよび障害」で説明されています。 |
GRP上で次のエラー メッセージが発生する %GRP-3-UCODEFAIL: Download failed to slot 5 |
ライン カードにダウンロードしたイメージが、ライン カードによってリジェクトされました。microcode reload 設定コマンドを使用して、マイクロコードをリロードしてみることができます。引き続きエラー メッセージが表示される場合は、「Cisco 12000 シリーズ インターネット ルータのラインカード ファームウェアのアップグレード」で説明されている upgrade all slot コマンドを使用して、MBUS エージェント ROM、MBUS エージェント RAM、およびファブリック ダウンローダをアップグレードしてみてください。また、この表にある「新しいラインカードが認識されない」という症状も参考にしてください。 |
GRP とラインカードは、クロスバー スイッチ ファブリックを経由して接続します。クロスバー スイッチ ファブリックは、ほとんどのカード間通信用に高速の物理パスを提供するものです。スイッチ ファブリックを介して GRP とラインカード間で送受信されるメッセージには、ルーティングされ受信される実際のパケット、転送情報、トラフィック統計、および大半の管理情報と制御情報などが含まれます。したがって、GRP にとって、このパスが適切に確保されていることが重要です。
次のようなファブリック関連のエラー メッセージがログに表示される場合、常にスイッチ ファブリックに問題があると考える必要があります。
%FABRIC-3-CRC: Switch card 18
または
%FABRIC-3-PARITYERR: To Fabric parity error was detected. Grant parity error Data = 0x2. SLOT 1:%FABRIC-3-PARITYERR: To Fabric parity error was detected. Grant parity error Data = 0x1
次のメッセージが表示されるときは、スイッチ ファブリックに関するハードウェア障害である場合と、そうでない場合があります。
05:21:11: %GRP-3-FABRIC_UNI: Unicast send timed out (2) 05:21:16: %GRP-3-FABRIC_UNI: Unicast send timed out (2)
こうした障害の症状が出ると、調査が必要です。この問題の詳細は、「トラブルシューティング:Cisco 12000 シリーズ インターネット ルータにおけるファブリック Ping のタイムアウトおよび障害」で説明されています。
スイッチ ファブリックの問題が疑われる場合は、次のステップに従ってください。
データを収集します。
LC に接続する場合には、attach コマンドを使用して、MBUS 上でデータを収集する必要があります。execute-on コマンドは、スイッチ ファブリックで行われている Inter-Process Communication(IPC; プロセス間通信)によって動作が異なります。IPC に関する問題(ファブリックの問題、ソフトウェアの不具合など)が起きている場合には、スイッチ ファブリックを経由してリモートで実行されているコマンドはタイムアウトになることがあります。通常、多量の出力を行うコマンドの場合は、LC に割り当てて、コマンドを実行することを推奨します。attach <slot #> コマンドは、常に MBUS 上で実行されます。
show controllers fia(GRP 上)
attach <slot #>、show controllers fia の順に実行し、exit と入力(各 LC とセカンダリ GRP に対して繰り返す)
show controllers clock(GRP上で)
show log(CSCマスターの変更を説明するOnline Insertion and Removal(OIR;活性挿抜)イベントを探します。ファブリック関連のエラーを探す)
show log summary(ファブリック関連のエラーを探す)
show log slot <slot #>
データを分析します。
ファブリックの問題は、次のコンポーネントのいずれかの障害が原因で起きることがあります。
コントロール プレーン - GRP
データ プレーン
Tofab LC のハードウェア
バックプレーン
CSC/SFC
Frfab LC のハードウェア
ファブリック エラーをトラブルシューティングする場合、エラーを報告しているコンポーネントがどれであるかについて、パターンを見つけ出すことから始めます。たとえば、すべての GRP と LC からの show controllers fia の出力を組み合わせて、1 つのパターンがあるかどうかを調べます。
注:このドキュメントの残りの部分では、LCと言う場合、これは任意のLCまたはGRPを指します。
show controllers fia コマンドの出力で crc16 が表示される場合は、この数が増えているかどうかをチェックすることが重要です。また、プライマリ GRP と他の GRP や LC から得たデータを関連付けることは非常に重要です。1 つの LC または 1 つのスイッチファブリック カード(CSC または SFC)をホットスワップ(OIR)した場合、何らかのファブリック エラー メッセージや crc16 が表示される可能性があります。ただし、その後に、この数が増えることはありません。この数字が増えている場合はハードウェア障害ですので、一部の部品を交換する必要があります。
次の出力では、プライマリ GRP とスロット 2 にある LC のステータスが分かります。
Router#show controllers fia Fabric configuration: Full bandwidth, redundant fabric Master Scheduler: Slot 17 Backup Scheduler: Slot 16 From Fabric FIA Errors ----------------------- redund fifo parity 0 redund overflow 0 cell drops 0 crc32 lkup parity 0 cell parity 0 crc32 0 Switch cards present 0x001F Slots 16 17 18 19 20 Switch cards monitored 0x001F Slots 16 17 18 19 20 Slot: 16 17 18 19 20 Name: csc0 csc1 sfc0 sfc1 sfc2 -------- -------- -------- -------- -------- los 0 0 0 0 0 state Off Off Off Off Off crc16 0 0 0 1345 0 To Fabric FIA Errors ----------------------- sca not pres 0 req error 0 uni FIFO overflow 0 grant parity 0 multi req 0 uni FIFO undrflow 0 cntrl parity 0 uni req 0 crc32 lkup parity 0 multi FIFO 0 empty dst req 0 handshake error 0 cell parity 0 Router#attach 2 Entering Console for 4 port ATM Over SONET OC-3c/STM-1 in Slot: 2 Type "exit" to end this session Press RETURN to get started! LC-Slot2> LC-Slot2>enable LC-Slot2#show controllers fia From Fabric FIA Errors ----------------------- redund FIFO parity 0 redund overflow 0 cell drops 0 crc32 lkup parity 0 cell parity 0 crc32 0 Switch cards present 0x001F Slots 16 17 18 19 20 Switch cards monitored 0x001F Slots 16 17 18 19 20 Slot: 16 17 18 19 20 Name: csc0 csc1 sfc0 sfc1 sfc2 -------- -------- -------- -------- -------- Los 0 0 0 0 0 state Off Off Off Off Off crc16 0 0 0 1345 0 To Fabric FIA Errors ----------------------- sca not pres 0 req error 0 uni fifo overflow 0 grant parity 0 multi req 0 uni fifo undrflow 0 cntrl parity 0 uni req 0 crc32 lkup parity 0 multi fifo 0 empty DST req 0 handshake error 0 cell parity 0 LC-Slot2#exit Disconnecting from slot 2. Connection Duration: 00:00:21 Router# ...
すべての show コマンドを解析すると、次のような表を作成できます。
この表は、複数のラインカードがSFC1からのエラーを報告していることを示しています。したがって、最初の手順はこのSFCを変更することです。一般的な障害のパターンと、推奨する対応策は次のとおりです(問題が解消するまで、一度に 1 ステップずつ実行してください)。
ヒント:交換が推奨される場合には、まず最初に、そのカードが正しく取り付けられていることを確認してください(以下参照)。 正しく取り付けられてことを確認するために、該当するカードを必ず取り付け直してください。ブレードを取り付け直した後でも CRC の数が増え続ける場合は、その部品を交換します。
同じファブリック カードに起因する Frfab エラーが複数の LC で起きる場合:
エラーが発生しているスロットにあるファブリック カードを交換します。
すべてのファブリック カードを交換します。
バックプレーンを交換します。
複数のファブリック カードに起因する Frfab エラーが 1 枚の LC で起きる場合:
LC を交換します。
エラーが増え続ける場合は、現在のマスター CSC を交換します。
エラーが増加せず、現在のマスターが CSC0 の場合は、CSC1 を交換します。
12016 および 12416 のスイッチ ファブリック カードは装着しにくいので、少し力を入れて装着しなければならない場合があります。正しく挿入されていない CSC があると、次のようなエラーメッセージが表示されます。
%MBUS-0-NOCSC: Must have at least 1 CSC card in slot 16 or 17 %MBUS-0-FABINIT: Failed to initialize switch fabric infrastructure
1/4 帯域幅構成に必要なだけの CSC および SFC しか挿入されていない場合も、このようなエラーメッセージが表示されることがあります。この場合、エンジン 1 以上のエンジンをベースとする LC はブートしません。
カードが正しく装着されているかどうかを確認するには、CSC/SFC上で4つのLEDが点灯しているかどうかを調べます。 そうでない場合、そのカードは正しく装着されていません。
ファブリックおよび LC がブートしない問題に対処する場合、必要な CSC および SFC がすべて正しく挿入され、電源がオンになっているかどうかを確認する必要があります。たとえば、12016 でフル帯域幅の冗長システムを構成するには、3つの SFC および2つの CSC が必要です。フル帯域幅の非冗長システムを実現するには、3 枚の SFC と 1 枚の CSC が必要です。
show version および show controllers fia コマンドの出力から、現在ボックス内で稼働しているハードウェア構成を確認することができます。
Router#show version Cisco Internetwork Operating System Software IOS (tm) GS Software (GSR-P-M), Experimental Version 12.0(20010505:112551) Copyright (c) 1986-2001 by cisco Systems, Inc. Compiled Mon 14-May-01 19:25 by tmcclure Image text-base: 0x60010950, data-base: 0x61BE6000 ROM: System Bootstrap, Version 11.2(17)GS2, [htseng 180] EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) BOOTFLASH: GS Software (GSR-BOOT-M), Version 12.0(15.6)S, EARLY DEPLOYMENT MAINTENANCE INTERIM SOFTWARE Router uptime is 17 hours, 53 minutes System returned to ROM by reload at 23:59:40 MET Mon Jul 2 2001 System restarted at 00:01:30 MET Tue Jul 3 2001 System image file is "tftp://172.17.247.195/gsr-p-mz.15S2plus-FT-14-May-2001" cisco 12016/GRP (R5000) processor (revision 0x01) with 262144K bytes of memory. R5000 CPU at 200Mhz, Implementation 35, Rev 2.1, 512KB L2 Cache Last reset from power-on 2 Route Processor Cards 1 Clock Scheduler Card 3 Switch Fabric Cards 1 8-port OC3 POS controller (8 POs). 1 OC12 POS controller (1 POs). 1 OC48 POS E.D. controller (1 POs). 7 OC48 POS controllers (7 POs). 1 Ethernet/IEEE 802.3 interface(s) 17 Packet over SONET network interface(s) 507K bytes of non-volatile configuration memory. 20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 8192K bytes of Flash internal SIMM (Sector size 256K). ... Router#show controller fia Fabric configuration: Full bandwidth nonredundant Master Scheduler: Slot 17 ...
Cisco 12000シリーズインターネットルータアーキテクチャを読むことを推奨します。スイッチファブリック」を参照してください。
次のタイプのエラーが発生する可能性があります。
コンソール ログまたは show log コマンドの出力:
%FABRIC-3-PARITYERR: To Fabric parity error was detected. Grant parity error Data = 0x2. SLOT 1:%FABRIC-3-PARITYERR: To Fabric parity error was detected. Grant parity error Data = 0x1
show controllers fiaコマンドの出力:
Router#show controllers fia Fabric configuration: Full bandwidth, redundant fabric Master Scheduler: Slot 17 Backup Scheduler: Slot 16 !-- Here you can see which CSC is the master CSC. By default CSC1 in slot 17 is the master From Fabric FIA Errors ----------------------- redund FIFO parity 0 redund overflow 0 cell drops 76 !-- You may see some cell drops as well crc32 lkup parity 0 cell parity 0 crc32 0 Switch cards present 0x001F Slots 16 17 18 19 20 Switch cards monitored 0x001F Slots 16 17 18 19 20 Slot: 16 17 18 19 20 Name: csc0 csc1 sfc0 sfc1 sfc2 -------- -------- -------- -------- -------- Los 0 0 0 0 0 state Off Off Off Off Off crc16 876 257 876 876 876 !-- You will see some crc16 To Fabric FIA Errors ----------------------- sca not pres 0 req error 1 uni fifo overflow 0 grant parity 1 multi req 0 uni fifo undrflow 0 !-- Grant parity and/or Request error counter not 0 cntrl parity 0 uni req 0 crc32 lkup parity 0 multi fifo 0 empty DST req 0 handshake error 0 cell parity 0
Fabric Interface ASIC(FIA; ファブリック インターフェイス ASIC)は、Gigabit Route Processor(GRP; ギガビット ルート プロセッサ)と Line Card(LC; ラインカード)の両方に存在します。 FIA は GRP/LC とスイッチ ファブリック カード(CSC/SFC)間のインターフェイスを提供していますが、Scheduler Control ASIC(SCA)は CSC にしか組み込まれていません。SCA はライン カードからの送信要求を処理し、ファブリックにアクセスするための許可を発行します。
req error - SCA が req ライン上でパリティ エラーを検出しました
grant parity - FIA が grant ライン上でパリティ エラーを検出しました
show controllers fia コマンドの出力を使用して、これらのエラーが複数のラインカードから報告されているかどうか、また CSC スイッチオーバーが発生しているかどうかを調べることができます。この出力を特定のライン カードから取得するには、attach <slot #> と入力し、LC-Slot プロンプトが表示された後で show controller fia コマンドを実行します。
注:前述したように、execute-on slot <slot #> show controllers fia コマンドは使用しないでください。Cisco IOS ソフトウェアでこのエラーを処理できない場合は、このコマンドを正しく実行できないためです。
複数の LC で grant エラーが発生する場合:
CSC を交換します(交換する CSC については、次の注を参照してください)。
バックプレーンを交換します。
1 枚の LC で grant エラーが発生する場合:
LC を交換します。
CSC を交換します(交換する CSC については、次の注を参照してください)。
バックプレーンを交換します。
注:複数のライン カードで grant parity エラー、または request エラーが報告され、なおかつボックスが動作を続けている場合、CSC スイッチオーバーが発生しています。障害のある CSC は、現在のバックアップ CSC です(show controller fia の出力で「Master Scheduler」としてリストされる CSC ではありません)。 「From Fabric FIA Errors」または「To Fabric FIA Errors」の見出しの横に「Halted」が表示されている場合、またはルータがトラフィックを転送しなくなっている場合には、CSC スイッチオーバーは発生しておらず、障害のある CSC は「Master Scheduler」としてリストされている CSC になります。 デフォルトでは、スロット 17 の CSC がプライマリで、スロット 16 の CSC がバックアップです。
Software Bug CSCdw10748(登録ユーザのみ)に対する修正が行われていない Cisco IOS ソフトウェア リリースが実行されているルータでは、grant parity エラーによってシステム レベルの障害が起きる場合があります。CSCdw10748(登録ユーザ専用)の修正により、このハードウェア障害が発生しても、冗長CSCを搭載したルータではシステムレベルの中断が発生しません。バックアップ CSC(搭載されている場合)へのフェールオーバーが実行されます。
CSCdw10748 に対する修正は、Cisco IOS ソフトウェア リリース 12.0(17)ST4、12.0(21)S、12.0(21)ST、12.0(19)ST02、12.0(19)S02、12.0(17)S04、12.0(18)S04、および 12.0(16)S07 で実装されています。
その他に、発生頻度は低いものの、show controllers fia コマンドの出力に表示されるエラーがあります。
First In First Out(FIFO)エラー:冗長データ オーバーフロー エラー。このエラーは、バック プレッシャが失敗した場合、つまり From Fab によってバック プレッシャが実行されても Scheduler Control ASIC(SCA)によってさらに多くのデータが与えられ続けた場合に発生します。この問題は、Clock Scheduler Card(CSC; クロック スケジューラ カード)に関連している可能性があります。 カードを取り付け直します。もし動作しない場合は、スワップしてみてください。
シリアル リンク エラー:この問題は、From Fab FIA と、いずれかの Switch Fabric Card(SFC; スイッチ ファブリック カード)または Clock Scheduler Card(CSC; クロック スケジューラ カード)との間の同期が失われた場合に発生します(このエラーはカードが引き抜かれた状態では発生しません)。 FIAには、一定のセル期間だけ待機してからFIAを停止させるメカニズムが組み込まれています。カードごとに1つのlossカウンタがあります。すべてのGRP/LCについて収集した情報に基づいて、どの部分に障害があるかを特定できるはずです。
FIFO エラー
uni FIFO overflow - Buffer Management ASIC(BMA)/Cisco Cell Segmentation and Reassembly(CSAR)と FIA 間の問題によって、ユニキャスト FIFO オーバーフローが発生しました。
uni FIFO underflow - SCA が実際には FIA からの要求を受け取っていないにもかかわらず許可を発行したことにより、ユニキャスト FIFO アンダーフローが発生しました。
FIFO エラーの場合、ライン カードまたは CSC のどちらに障害があるかを判別するのは困難です。多数のカードにエラーが表示される場合は、CSC に問題があると考えられます。
ファブリック エラー:sca not pre : マスター SCA(Scheduler Control ASIC)が動作していません。このエラーへの対処としては、何もせず、上位レイヤが問題を検出するまで待ちます。このレベルで冗長 CSC への切り替えが自動的に行われない理由は、2 つの SCA が同期されているかどうかがわからないためです。最初の電源投入後に CSC カードが取り付けられた場合、SCA チップの同期は行われません。Fabric Interface ASIC(FIA; ファブリック インターフェイス ASIC)は、Gigabit Route Processor(GRP; ギガビット ルート プロセッサ)と Line Card(LC; ラインカード)の両方に存在します。 FIA は GRP/LC とスイッチ ファブリック カード(CSC/SFC)間のインターフェイスを提供していますが、Scheduler Control ASIC(SCA)は CSC にしか組み込まれていません。SCA はライン カードからの送信要求を処理し、ファブリックにアクセスするための許可を発行します。
または
%FIA-3-PARITYERR: To Fabric parity error was detected. %FIA-3-HALT: To Fabric Request parity error interrupt = 0x4
show controllers fiaコマンドの出力を使用して、複数のラインカードがこれらのエラーを報告しているかどうか、およびCSCスイッチオーバーが発生しているかどうかを判別できます。特定のラインカードからこの出力を取得するには、attach slot no:LC-Slotプロンプトが表示された後、show controller fiaコマンドを実行します。
BMA/CSARハンドシェイクエラー:このエラーには、問題の原因を示すパリティエラーが含まれている必要があります。
ソフトウェア要求エラー:FIA に発生するその他のエラーで、FIA を停止させたり割り込みを引き起こしたりしないものがあります。これらのエラーは 1 秒ごとにポーリングされてカウントされます。To Fabric 側では、これらのエラーはソフトウェア要求エラーです。次のエラーが検出されます。
multi req - マルチキャスト要求に単一の宛先が指定されています。FIA はこのセルを宛先に送信します。Bug CSCdw05067(show controller fia の出力で、マルチキャストで実行される ATM LC に対して複数の要求が表示される)に注意してください。ATM Engine 0(1xOC12 および 4x0C3)ラインカードによって、分散型マルチキャスト トラフィックを処理するライン カードでの show controller fia コマンドの出力に「multi request」エラーが記録される場合があります。単一の宛先ライン カードだけに分散スイッチングされるマルチキャスト パケットごとに、このエラーが発生します。この現象は純粋に表面的なものであり、ドロップは発生していません。回避するには、分散型マルチキャスト スイッチングをディセーブルにします。
uni req - ユニキャスト要求に複数の宛先が指定されています。FIA はこのセルをドロップします。
empty DST req - 宛先が空白の要求。FIA はこのセルをドロップします。
初期ブートアップの際、プライマリ GRP では、ラインカードやスイッチ カードにある MBUS モジュールに対してカードに電源を入れるように、MBUS を使用して指示します。その後、ブートストラップのイメージが MBUS 経由でラインカードにダウンロードされます。MBUS は、リビジョン番号、環境情報、および一般的なメンテナンス情報の収集にも使用されます。さらに、GRP は MBUS 上で冗長メッセージを交換し、それによって GRP 調停の結果が報告されます。
次のメッセージは問題のないもので、ルータが正常に動作しているときに表示されます。このようなメッセージが表示される場合、措置は不要です。
%MBUS-6-GRP_STATUS: GRP in Slot 0 Mode = MBUS Secondary
%MBUS-6-FIA_CONFIG: Switch Cards 0x1F (bit mask); Primary Clock CSC_1
メッセージが問題のないものであるかどうか、対処が必要かどうかを判断するには、Error Message Decoder(登録ユーザのみ)ツールを使用してください。
次のような「upgrade warning」メッセージが表示される場合:
%MBUS-0-DOWNREV: Fabric Downloader in slot 2; use "upgrade fabric-downloader" command to update the image
ライン カードのファブリック ダウンローダのバージョンが、プライマリ GRP で現在実行されている Cisco IOS ソフトウェア リリースのバージョンと合致しているかどうかを確認してください。MBUS エージェント RAM、ファブリック ダウンローダなどを同期させるには、service upgrade all を設定し、設定を保存し、ルータをリロードします。リロードだけでは不十分な場合もありますが、電源のオフ/オンによって解消します。Cisco IOS ソフトウェア リリースのサポートに十分な量のルート メモリが、ライン カードに搭載されていることを確認してください。
詳細については、『Cisco 12000 シリーズ ルータのラインカード ファームウェアのアップグレード』を参照してください。
MBUSの目的とMBUS関連のエラーメッセージの詳細については、「Cisco 12000シリーズインターネットルータアーキテクチャ:メンテナンスバス、電源・ブロアー・アラームカード.
Cisco 12000 シリーズ ルータは、AC 電源、DC 電源のどちらの構成でも使用できます。電源装置はいずれもロード シェアリングおよびホットスワップ対応です。
実際には低電圧ではないにもかかわらず、低電圧が報告されるソフトウェア バグがあります。ソフトウェアダウンロードエリアで入手可能な最新のCisco IOSソフトウェアリリースイメージを実行して、それまでの間に修正された既知の電圧関連ソフトウェアの不具合をすべて取り除いてください。
さまざまなタイプのシャーシに関する興味深いリンクについては、『Cisco 12000シリーズインターネットルータアーキテクチャ:メンテナンスバス、電源・ブロアー・アラームカード.
12000 シャーシのタイプごとに、異なるタイプのアラーム カードがあります。Cisco 12008 および 12016/12416 では、アラーム カードによって LC に電源が供給されるため、少なくとも 1 枚のアラーム カードを装着してください。12008 はアラーム カードを 1 枚必要とします。これはアラーム カードが card scheduler and clock(CSC; クロック スケジューラ カード)に組み込まれているためです。 12016 と 12416 には、アラーム カード用のスロットが 2 つあります(冗長構成用)。 2 つのアラーム カードには、12016 の DC 電源モジュールのようなセグメント化されたサービス ゾーンはありません。
12404 では、統合スイッチ ファブリック カードをサポートしています。このカードでは、スイッチ ファブリック、アラーム、クロックとスケジュール機能が 1 枚のボードに納められています。
Cisco 12000シリーズインターネットルータには、さまざまなタイプのシャーシに関する興味深いリンクがあります。アラーム カード.
「Cisco 12000シリーズインターネットルータのラインカード障害のハードウェアトラブルシューティング」ドキュメントでは、ラインカード障害を特定してトラブルシューティングする手順について説明しています。Cisco 12000シリーズインターネットルータでのラインカードのクラッシュに関するトラブルシューティング』には、ラインカードのクラッシュに関するトラブルシューティング情報が記載されています。
「Cisco 12000 シリーズ インターネット ルータのパリティ エラーのフォールト ツリー」では、Cisco 12000 シリーズ インターネット ルータでさまざまなパリティ エラー メッセージが発生した際のトラブルシューティングの手順や、問題のある部分やコンポーネントを切り離すための手順について説明されています。
上記のトラブルシューティング手順に従ってもサポートが必要でし、Cisco TACでサービスリクエスト(登録ユーザのみ)をオープンする場合は、Cisco 12000シリーズインターネットルータのハードウェア問題のトラブルシューティングに関して次の情報を必してください。 |
---|
収集したデータは、圧縮しないプレーンなテキスト形式(.txt)でサービス リクエストに添付してください。 情報をケースに添付するには、Support Case Manager(登録ユーザ専用)を使用してアップロードします。 Service Request Tool にアクセスできない場合は、情報を電子メールの添付ファイルとし、メッセージの件名にサービスリクエスト番号を付けて attach@cisco.com 宛てに送信してください。これにより、サービスリクエストに関連する情報が添付されます。 注:問題の根本原因を特定するために必要な重要な情報が失われる可能性があるため、必要な場合を除き、上記の情報を収集する前に手動でルータをリロードしたり、ルータの電源をオフ/オンしたりしないでください。 |