はじめに
このドキュメントでは、Catalyst 9200/9200L および 9300/9300L の StackWise 展開における一般的な障害シナリオのトラブルシューティング方法について説明します。
前提条件
使用するコンポーネント
ここでは、Catalyst 9000 ファミリの StackWise に関連する製品 ID(PID)および関連コンポーネントを示します。
このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されました。このドキュメントで使用するすべてのデバイスは、クリアな(デフォルト)設定で作業を開始しています。本稼働中のネットワークでは、各コマンドによって起こる可能性がある影響を十分確認してください。
StackWise のプラットフォーム
リング速度は PID によって異なります。次の PID は StackWise をサポートしています。
- Cisco Catalyst 9200:StackWise-160
- Cisco Catalyst 9200L:StackWise-80
- Cisco Catalyst 9300:StackWise-480
- Cisco Catalyst 9300L:StackWise-320
- Cisco Catalyst 9300X:StackWise-1T
StackWise のハードウェア
C9200/C9200L および C9300L PID スタックキットには、シャーシに装着するスタックアダプタと、アダプタに接続するケーブルが含まれています。C9300/9300X PID スタックキットにはケーブルのみが必要です。
背景説明
この項目は、Catalyst 9200/9200L、9300/9300L、および 9300X スイッチに適用されます。
StackWise アーキテクチャでは、リングトポロジ内に最大 8 つのスイッチをスタックして、高密度のスタック帯域幅を実現できます。スタックアーキテクチャは、スイッチのフォームファクタ、スループット、ポート密度、および冗長性を拡張し、単一の制御および管理プレーンを提供します。これにより、管理が簡素化され、復元力と拡張性が向上します。
StackWise のトラブルシューティングと検証
確立されたスタックでの動作に関する問題は、多くの場合、1 つまたはすべてのメンバーデバイスのサイレントリロードに関連しており、一般的なリロードの原因はスタックのマージです。 このセクションでは、スタックリングの不安定性がどのようにリロードやその他の問題を引き起こす可能性があるのかと、スタックリングを検証して関連する問題をトラブルシュートする方法について説明します。
StackWise の動作
2 つ以上(最大 8 つ)のスイッチを関連する StackWise スタックキットに接続して、データスタックを形成します。スタックリングは、アクティブ/スタンバイスイッチとメンバースイッチの間の相互接続を提供します。リングは半分の容量または全容量で動作できます。
スタック ディスカバリ プロトコル(SDP)が、スタックトポロジに接続されたスイッチによって、ネイバーの検出とロールの選択に使用されます。 起動後、スイッチソフトウェアが完全にロードされる前に、メンバーが検出され、アクティブロールとスタンバイロールが決定される 120 秒の選択時間があります。
アクティブの選択は、最も高い優先順位、次に最も低い MAC アドレスによって決定されます。アクティブが選択され、すべてのメンバーが検出されると、スタンバイが同じ基準(次に高い優先順位または次に低い MAC)で選択されます。 その他の考慮事項は、次のとおりです。
- スイッチの優先順位は手動で設定されます。変更はリロード後に有効になります。
- スイッチ番号は、リロード後およびメンバーの削除後も維持されます。
- スイッチ番号の競合は、アクティブによって解決されます。
- スイッチ番号には、スタック内のスイッチの物理的な方向は反映されません。
メンバーの追加または置き換え
新しいスタックを実装するときや、確立されたスタックにメンバーを追加するときは、いくつかの要因を考慮する必要があります。 重要なこととして、電源が入っているスイッチは、電源が入っているスタックに決して接続しないでください。スタックのマージを避けるために、新しいメンバーは、電源を切った状態で接続してください。 その他の考慮事項は、次のとおりです。
- Cisco IOS® XE のバージョンが一致している必要があります。
- 動作モード(インストールとバンドル)が一致している必要があります。
新しいスイッチを追加するときに自動アップグレード機能を利用すると、これらの競合の問題を解決できます。これは、次のコマンドで実装されます。
C9300-Stack#config t
Enter configuration commands, one per line. End with CNTL/Z.
C9300-Stack(config)#software auto-upgrade enable
C9300-Stack(config)#end
C9300-Stack#
注:自動アップグレード機能はインストールモードでのみ使用できます。バンドルモードは自動アップグレードをサポートしていません。 バンドルモードでは、バージョンライセンスの不一致エラーを解決するために手動での操作が必要です。
StackWise 関連の動作に関する問題のトラブルシュート
アクティブ/スタンバイとメンバーの間の通信が中断されると、リロードが発生します。 慢性的な不安定性は、スタックが分割およびマージする状況につながる可能性があります。
スタック関連の不安定性のほとんどは、物理スタックメディア(スタックケーブルとスタックアダプタのいずれかまたは両方)の位置ずれに起因します。スタックメンバーが慢性的に不安定な場合は、スタックハードウェアを装着しなおして、ケーブルのつまみネジを手で締めてください。 このドキュメントの後半で説明する検証コマンドを使用して、最も影響を受けるメンバーを特定します。
問題:1 つ以上のメンバーの予期しないリロード
アクティブとスタンバイは、メンバーデバイスとだけでなく、相互に制御トラフィックを交換します。 スタックメンバーとスタンバイ/アクティブの間の通信が中断されると、リロードが発生します。
最後のリロードの理由は、show version コマンドの出力で確認できます。
C9300-Stack#show version
Cisco IOS XE Software, Version 16.12.05b
Cisco IOS Software [Gibraltar], Catalyst L3 Switch Software (CAT9K_IOSXE), Version 16.12.5b, RELEASE SOFTWARE (fc3)
Technical Support: http://www.cisco.com/techsupport
Copyright (c) 1986-2021 by Cisco Systems, Inc.
Compiled Thu 25-Mar-21 13:21 by mcpre
<snip>
C9300-Stack uptime is 2 days, 1 hour, 18 minutes
Uptime for this control processor is 2 days, 1 hour, 20 minutes
System returned to ROM by Reload Command
System image file is "flash:packages.conf"
Last reload reason: stack merge
スタックの不安定性が影響する場合に見られるリロードの一般的な理由は、次のとおりです。
スタック内の特定スイッチの稼働時間履歴を表示するには、show logging onboard switch <number> uptime detail コマンドを使用します。
C9300-Stack#show logging onboard switch 3 uptime detail
--------------------------------------------------------------------------------
UPTIME SUMMARY INFORMATION
--------------------------------------------------------------------------------
First customer power on : 06/23/2020 04:08:31
Total uptime : 1 years 0 weeks 6 days 23 hours 49 minutes
Total downtime : 0 years 12 weeks 6 days 11 hours 51 minutes
Number of resets : 84
Number of slot changes : 5
Current reset reason : Reload Command
Current reset timestamp : 09/26/2021 14:49:07
Current slot : 3
Chassis type : 22
Current uptime : 0 years 0 weeks 2 days 1 hours 0 minutes
--------------------------------------------------------------------------------
--------------------------------------------------------------------------------
UPTIME CONTINUOUS INFORMATION
--------------------------------------------------------------------------------
Time Stamp | Reset | Uptime
MM/DD/YYYY HH:MM:SS | Reason | years weeks days hours minutes
--------------------------------------------------------------------------------
<snip>
09/06/2021 21:47:16 stack merge 0 0 0 14 0
09/06/2021 21:52:42 stack merge 0 0 0 0 0
09/06/2021 22:06:01 stack merge 0 0 0 0 10
<snip>
09/20/2021 15:48:38 Reload Command 0 0 0 0 25
09/20/2021 16:11:59 Reload Command 0 0 0 0 20
09/26/2021 14:49:07 stack merge 0 0 5 22 0
--------------------------------------------------------------------------------
スタックの不安定性に関連するリロードの大部分は、スタックハードウェアを装着しなおすことで解決できます。 検証コマンドを使用して、不安定なスイッチとそのリロードの頻度を判別し、このメンバーに関連付けられたスタックハードウェアを装着しなおします。
show switch stack-ports summary コマンドを使用すると、不安定なデバイスをすばやく特定できます。
C9300-Stack#show switch stack-ports summary
Sw#/Port# Port Status Neighbor Cable Length Link OK Link Active Sync OK #Changes to LinkOK In Loopback
-------------------------------------------------------------------------------------------------------------------
1/1 OK 2 50cm Yes Yes Yes 1 No
1/2 OK 3 50cm Yes Yes Yes 6 No
2/1 OK 3 50cm Yes Yes Yes 8 No
2/2 OK 1 50cm Yes Yes Yes 6 No
3/1 OK 1 50cm Yes Yes Yes 6 No
3/2 OK 2 50cm Yes Yes Yes 1 No
この例では、スイッチ 2 で慢性的なリロードが発生しています。このスイッチにあるスタックポートの両方で、リンクステータスに多数の変化が発生していることが分かります。 スイッチ 1 とスイッチ 3 も同様ですが、多くの場合、これらの値はスイッチ 2 のリロードと相関しています。スイッチ 1 をスイッチ 2 に接続するスタックハードウェアと、スタック 2 とスタック 3 の間のハードウェアを装着しなおします。スイッチ 1 とスイッチ 3 の間の接続はフラップしていません。
スタックの動作中にスタック接続を装着しなおすことはできますが、一度に装着しなおすリンクは 1 つだけにしてください。 メンバースイッチを完全に切断すると、再導入時にスタックのマージが発生します。
StackWise に関連する以前のバージョンのコードには、既知のソフトウェアの欠陥があります。スタックハードウェアを装着しなおしても問題が解決しない場合は、推奨バージョンにアップグレードするか TAC に連絡してください。
関連する Bug ID:
StackWise プラットフォームのスタックハードウェアに影響を与える既知の問題もあり、それは認証の失敗として現れます。C9200L からのエラーメッセージの例を次に示します。
Stack Adapter Auth Fail : SIF_SERDES_CABLE_EASTBOUND
*** Stack adapter authentication failed on stack port 1 on switch 1
Error-2:
*** Stack adapter authentication failed on stack port 2 on switch 1
Stack Adapter Auth Fail : SIF_SERDES_CABLE_WESTBOUND
関連する Bug ID:
この状態が発生し、リロード後も持続する場合は、コンポーネント自体が影響を受ける可能性があります。支援が必要な場合は、テクニカル アシスタンス センター(TAC)に連絡してください。
問題:スタックのメンバーを追加/置換できない
メンバーが参加しない場合、それは、StackWise の前提条件が満たされていないか、新しいメンバーとスタックの残りの部分との間の接続に問題があることを示しています。
StackWise の次の前提条件が満たされていることを確認してください。
- 新しいメンバーのソフトウェアバージョンは、スタックのソフトウェアバージョンと一致している必要があります。
- ライセンスレベルが一致している必要があります。
- 動作モード(インストールとバンドル)が一致している必要があります。
- 混合 PID スイッチのスタックはサポートされていません(具体的な詳細についてはデータシートを参照)。
スタックキットが正しく取り付けられていることを確認します。C9200L および C9300L にはスタックアダプタが必要です。つまみネジを手で締めて、ハードウェアを適切な方向に向けます。ネジを過度に締め付けないように注意してください。
StackWise-80 スタックキット(C9200L)
C9300 スタックキット STACK-T1-XXCM を使用する場合、ケーブルは、シャーシに上下逆さまに装着できるように製造されています。正しく取り付けるために、シスコのロゴが上を向いていることと、取り付けネジを完全に固定できることを確認してください。
StackWise-480 ケーブル接続
注:金属部分にシスコのロゴが削り出されています。正しく取り付けるために、このロゴが右側の上にあり、上下逆さまになっていないことを確認してください。
前提条件が満たされ、ハードウェアが適切に取り付けられている場合は、問題のあるスイッチがスタックハードウェアを認識していることを確認します。次の出力は、C9200L 固有のものです。
Switch#show inventory
NAME: "c92xxL Stack", DESCR: "c92xxL Stack"
PID: C9200L-24P-4X , VID: V01 , SN: JAE2332006G
NAME: "Switch 1", DESCR: "C9200L-24P-4X" <<<---- This entry represents the chassis
PID: C9200L-24P-4X , VID: V01 , SN: JAE2332006G
NAME: "StackPort1/1", DESCR: "StackPort1/1" <<<--- This entry represents the 50CM cable connected in Stackport 1/1
PID: STACK-T4-50CM , VID: V01 , SN: LCC2325G3XW
NAME: "StackPort1/2", DESCR: "StackPort1/2" <<<--- This entry represents the 50CM cable connected in Stackport 1/2
PID: STACK-T4-50CM , VID: V01 , SN: LCC2325G410
NAME: "StackAdapter1/1", DESCR: "StackAdapter1/1"
PID: C9200-STACK , VID: V01 , SN: JAE2332133J <<<--- This entry represents the stack adapter in Stackport 1/1
NAME: "StackAdapter1/2", DESCR: "StackAdapter1/2"
PID: C9200-STACK , VID: V01 , SN: JAE23321DDK <<<--- This entry represents the stack adapter in Stackport 2/2
スイッチがスタックキットの 1 つ以上のコンポーネントを認識しない場合は、さらに調査する必要があります。 TAC に問い合わせてサポートを受けてください。
問題:C9300X 混合スタックがサブリングに分割される/スタック速度が一致しない
C9300X では高速(1TB)が導入されています。C9300X スタックと非高速スタックの混合スタックはサポートされていますが、この場合のスタック全体のスタックリング速度は、最も遅いメンバーの速度と一致します。
スタックインターフェイスの速度が一致しないと、スタックが分割されます。show switch stack-ring speed でスタックリングの速度を確認してください。
Device#show switch stack-ring speed
Stack Ring Speed : 1000G
Stack Ring Configuration: Full
Stack Ring Protocol : StackWise
Stack Ring Next-boot Speed: 1000G
次を使用してスタックリングの速度を変更します。stack-speed [high | low]。
Device# switch stack-speed high
StackWise の確認と検証
このセクションでは、スタックが正しく設定され、期待どおりに動作していることを確認するために、Stackwisetoを検証および検証するコマンドを示します。
show switch detail コマンドにより、スタックハードウェア、ポートステータス、およびネイバーの詳細に関する情報が提供されます。また、このコマンドにより、現在のアクティブスイッチとスタンバイスイッチ、およびメンバースイッチも識別できます。
C9300-Stack#show switch detail
Switch/Stack Mac Address : 9077.ee4a.6b00 - Local Mac Address
Mac persistency wait time: Indefinite
H/W Current
Switch# Role Mac Address Priority Version State
-------------------------------------------------------------------------------------
*1 Active 9077.ee4a.6b00 15 V03 Ready
2 Standby 7cad.4f5f.e000 1 V03 Ready
3 Member 9077.ee4a.6e00 1 V03 Ready
Stack Port Status Neighbors
Switch# Port 1 Port 2 Port 1 Port 2
--------------------------------------------------------
1 OK OK 2 3
2 OK OK 3 1
3 OK OK 1 2
show switch stack-ports summary コマンドにより、スタックリングの特性に関する詳細情報が提供されます。
ヒント:「#Changes to Link OK」に注意してください。この列の値が 1 より大きい場合は、不安定性を示している可能性があります。
C9300-Stack#show switch stack-ports summary
Sw#/Port# Port Status Neighbor Cable Length Link OK Link Active Sync OK #Changes to LinkOK In Loopback
-------------------------------------------------------------------------------------------------------------------
1/1 OK 2 50cm Yes Yes Yes 1 No
1/2 OK 3 50cm Yes Yes Yes 1 No
2/1 OK 3 50cm Yes Yes Yes 1 No
2/2 OK 1 50cm Yes Yes Yes 1 No
3/1 OK 1 50cm Yes Yes Yes 1 No
3/2 OK 2 50cm Yes Yes Yes 1 No
show switch stack-bandwidth コマンドを使用すると、スイッチが半分の容量または全容量で動作しているかどうかをすばやく識別できます。
C9300-Stack#show switch stack-bandwidth
Stack Current
Switch# Role Bandwidth State
------------------------------------------------------------
*1 Active 480G Ready
2 Standby 480G Ready
3 Member 480G Ready
contact TAC
修復を試みても問題が解決しない場合は、TAC に連絡してください。遅延を防ぐために、TAC ケースが関連データとともに送信されていることを確認してください。役立つデータセットには以下が含まれます。
出力:show technical-support
このユーティリティにより、関連する一連の show コマンドの出力が提供されます。出力は冗長であるため、ユーティリティを実行する際はそのことに注意してください。出力をファイルにリダイレクトするか、出力をテキスト形式で保存して、TAC ケースにアップロードします。
C9300-Stack#show tech-support
アーカイブファイル:バイナリ トレースログ アーカイブ
このユーティリティでは、プラットフォームの永続的なトレース機能が活用されます。次のコマンドを使用して、ローカルフラッシュメディアに保存されるアーカイブを生成します。
C9300-Stack#request platform software trace slot switch 1 r0 archive
Creating archive file [flash:C9300-Stack_1_RP_0_trace_archive-20210929-151348.tar.gz]
Done with creation of the archive file: [flash:C9300-Stack_1_RP_0_trace_archive-20210929-151348.tar.gz]
C9300-Stack#request platform software trace slot switch 2 r0 archive
Creating archive file [flash-2:RP_0_trace_archive-20210929-151358.tar.gz]
Done with creation of the archive file: [flash-2:RP_0_trace_archive-20210929-151358.tar.gz]
C9300-Stack#request platform software trace slot switch 3 r0 archive
Creating archive file [flash-3:RP_0_trace_archive-20210929-151450.tar.gz]
Done with creation of the archive file: [flash-3:RP_0_trace_archive-20210929-151450.tar.gz]
このユーティリティは、メンバーごとに実行されます。ファイルの名前と場所は、ユーティリティの出力に示されます。このファイルは、ユーティリティが実行されたスイッチのローカルフラッシュメディアに書き込みます。このファイルを TAC ケースに添付してください。
多くの場合、予期しないリロードの前に、ローカルメディアへのバイナリトレースダンプが発生します。これらのアーカイブは有用で、手動で作成したアーカイブでは見逃されるデータを表します。
各メンバーの flash/crashinfo 内を調べて、関連するファイルが書き込まれているかどうかを確認します。システムが回復する直前に書き込まれたファイルを探します。
システムが再起動した日時を確認するには、show version コマンドまたは show logging onboard switch <number> detail コマンドを使用します。
C9300-Stack#show version
Cisco IOS XE Software, Version 16.12.01
Cisco IOS Software [Gibraltar], Catalyst L3 Switch Software (CAT9K_IOSXE), Version 16.12.1, RELEASE SOFTWARE (fc4)
Technical Support: http://www.cisco.com/techsupport
Copyright (c) 1986-2019 by Cisco Systems, Inc.
Compiled Tue 30-Jul-19 19:26 by mcpre
<snip>
<snip>
C9300-Stack uptime is 5 hours, 5 minutes
Uptime for this control processor is 4 hours, 50 minutes
System returned to ROM by SSO Switchover
System restarted at 14:04:40 EST Sun Feb 14 2021
System image file is "flash:packages.conf"
Last reload reason: stack merge
C9300-Stack#show logging onboard switch 2 uptime detail
--------------------------------------------------------------------------------
UPTIME SUMMARY INFORMATION
--------------------------------------------------------------------------------
First customer power on : 02/12/2020 00:56:09
Total uptime : 0 years 0 weeks 5 days 0 hours 28 minutes
Total downtime : 0 years 13 weeks 0 days 18 hours 31 minutes
Number of resets : 22
Number of slot changes : 1
Current reset reason : stack merge
Current reset timestamp : 02/14/2021 14:04:40
Current slot : 2
Chassis type : 52
Current uptime : 0 years 0 weeks 0 days 8 hours 0 minutes
--------------------------------------------------------------------------------
<snip>
システムのリロードに対応する、または直前に発生したアーカイブを探します。ファイル名には、「system-report」と、通常、TAC が調査に使用できる実用的な情報が含まれています。
TAC は、関心のある追加のアーカイブを特定できます。
C9300-Stack#dir crashinfo:
-#- --length-- ---------date/time--------- path
2 16384 Feb 14 2021 18:51:37.0000000000 +00:00 tracelogs
3 1623 Feb 14 2021 14:02:08.0000000000 +00:00 tracelogs/flashutil_R0-0.7398_0.20210214190148.bin.gz
4 358 Feb 14 2021 14:02:08.0000000000 +00:00 tracelogs/binos_R0-0.6831_0.20210214190148.bin.gz
5 63823 Feb 12 2021 06:45:15.0000000000 +00:00 tracelogs/dmesg
6 10 Feb 12 2021 06:45:15.0000000000 +00:00 tracelogs/timestamp
7 935 Feb 14 2021 14:02:08.0000000000 +00:00 tracelogs/install_engine_R0-0.3330_0.20210214190144.bin.gz
8 730 Feb 14 2021 14:02:08.0000000000 +00:00 tracelogs/tdl_boottime_R0-0.6801_0.20210214190148.bin.gz
9 1149 Feb 14 2021 14:02:08.0000000000 +00:00 tracelogs/issu_boottime_R0-0.6809_0.20210214190148.bin.gz
<snip>
271 2509408 Feb 14 2021 13:41:46.0000000000 +00:00 system-report_2_20210214-134145-EST.tar.gz
272 1813204 Feb 14 2021 14:00:24.0000000000 +00:00 system-report_2_20210214-140023-EST.tar.gz
要約
1 つまたは複数のスイッチが 1 日に数回リロードする慢性的な不安定性には、スタックキットを装着しなおすことによって即座に対処してください。
1 つ以上のメンバーが予期せずリロードするスタック関連のリロードの場合は、不安定なメンバーを特定し、それらのスイッチがスタックに正しく接続されていることを確認してください。問題が解決しない場合は、スイッチで推奨コードが実行されていることを確認し、TAC に連絡してください。
関連情報
Catalyst 9200 シリーズ スイッチの Cisco StackWise アーキテクチャに関するホワイトペーパー
Catalyst 9300 StackWise システムアーキテクチャに関するホワイトペーパー
Cisco IOS XE Amsterdam 17.3.x(Catalyst 9200 スイッチ)スタッキングおよびハイ アベイラビリティ コンフィギュレーション ガイド
Cisco IOS XE Bengaluru 17.5.x(Catalyst 9300 スイッチ)スタッキングおよびハイ アベイラビリティ コンフィギュレーション ガイド
テクニカル サポートとドキュメント - Cisco Systems