このドキュメントでは、Cisco Nexus 7000 6.0KW AC電源モジュール(PSU)障害アラートの考えられる原因と推奨される修正措置について説明します。
次の項目に関する基本的な知識が推奨されます。
このドキュメントの情報は、次のソフトウェアとハードウェアのバージョンに基づいています。
このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されました。このドキュメントで使用するすべてのデバイスは、初期(デフォルト)設定の状態から起動しています。対象のネットワークが実稼働中である場合には、どのようなコマンドについても、その潜在的な影響について確実に理解しておく必要があります。
N7K電源モジュールは、いくつかの異なる理由で障害としてリストされ、それぞれがシャーシに供給される電源にさまざまな影響を与えます。
電源モジュールの障害は、次のような多数の場所で障害として報告できます。
Nexus7000# show environment power
Power Supply:
Voltage: 50 Volts
Power Actual Total
Supply Model Output Capacity Status
(Watts ) (Watts )
------- ------------------- ----------- ----------- --------------
1 N7K-AC-6.0KW 350 W 6000 W Ok
2 N7K-AC-6.0KW 470 W 6000 W Fail/Shut
3 N7K-AC-6.0KW 313 W 6000 W Ok
<snip>
2013 Dec 1 22:29:20.814 Nexus7000 PLATFORM-2-PS_FAIL Power supply 2
failed or shut down (Serial number AZS1000000W)
N7K電源モジュールに障害が発生すると、障害の理由が電源装置(PSU)のオンボード8ビットレジスタに保存されます。 これらのレジスタを表示するには、show environment power detailコマンドをCLIに入力し、出力のHardware alam_bits行を探します。
Nexus7000# show environment power detail
<snip>
Power Usage Summary:
--------------------
Power Supply redundancy mode (configured) PS-Redundant
Power Supply redundancy mode (operational) PS-Redundant
Total Power Capacity (based on configured mode) 12000 W
Total Power of all Inputs (cumulative) 18000 W
Total Power Output (actual draw) 3060 W
Total Power Allocated (budget) 5593 W
Total Power Available for additional modules 6407 W
Power Usage details:
--------------------
Power reserved for Supervisor(s): 420 W
Power reserved for Fabric Module(s): 500 W
Power reserved for Fan Module(s): 1273 W
Total power reserved for Sups,Fabrics,Fans: 2193 W
Are all inlet chords connected: Yes
Power supply details:
---------------------
PS_1 total capacity: 6000 W Voltage:50V
chord 1 capacity: 3000 W
chord 1 connected to 220v AC
chord 2 capacity: 3000 W
chord 2 connected to 220v AC
Software-Alarm: No
Hardware alam_bits reg0:1A, reg1: 0, reg2: 0, reg3:10
Reg0 bit1: restarted successfully
Reg0 bit3: loss of line1
Reg0 bit4: loss of line2
Reg3 bit4: reserved
PS_2 total capacity: 6000 W Voltage:50V
chord 1 capacity: 3000 W
chord 1 connected to 220v AC
chord 2 capacity: 3000 W
chord 2 connected to 220v AC
Software-Alarm: No
Hardware alam_bits reg0: 2, reg1: 0, reg2:80, reg3: 10
Reg0 bit1: restarted successfully
PS_3 total capacity: 6000 W Voltage:50V
chord 1 capacity: 3000 W
chord 1 connected to 220v AC
chord 2 capacity: 3000 W
chord 2 connected to 220v AC
Software-Alarm: No
Hardware alam_bits reg0:1A, reg1: 0, reg2: 0, reg3:10
Reg0 bit1: restarted successfully
Reg0 bit3: loss of line1
Reg0 bit4: loss of line2
Reg3 bit4: reserved
この例では、電源2(PS_2)に次の機能が備わっていることがわかります。
8ビットレジスタに設定されているビットを判別するには、16進数(HEX)値を8ビットのバイナリ値に変換する必要があります。以下が一例です。
登録 | HEX値 | 2 進数値 | ビットセット(0ベース) |
---|---|---|---|
reg0 | 0 | 0000 0010 | 1 |
reg2 | 80 | 1000 0000 | 7 |
reg3 | 10 | 0001 0000 | 4 |
このセクションで提供されているテーブルに基づいて、レジスタ番号とビットセットを照合して、障害の原因と推奨される修正措置を見つけます。
ビット | デフォルト値 | ビット名 | コメント | 推奨処置 |
---|---|---|---|---|
7
|
0
|
PECエラー | SMBusの書き込みサイクルでPECエラーが検出された場合は1にラッチします(スーパーバイザによって読み取りサイクルPECがチェックされます)。 | リセットして再発生をモニタします。SMBus上の他のデバイスのPECエラーのインスタンスを探します。 |
6
|
0
|
無効なアクセス | 読み取り専用または未使用のレジスタまたはロケーションが書き込まれたり、未使用のロケーションが読み取られたりすると、ラッチは1になります。 | リセットして再発生をモニタします。SMBus上の他のデバイスのエラーインスタンスを探します。 |
5
|
0
|
データが範囲外です | 制御レジスタを無効な値に変更しようとすると、1にラッチします。 | リセットして再発生をモニタします。SMBus上の他のデバイスのエラーインスタンスを探します。 |
4
|
0
|
AC損失2 | AC回線2は<スペックが許可されています。ラッチ | AC入力を確認します。 |
3
|
0
|
AC損失1 | AC回線1は<スペックが許可されています。ラッチ | AC入力を確認します。 |
0
|
0
|
シャットダウンしました | 電源のシャットダウンが発生した場合は1にラッチします。 | PSUスイッチを確認します。 |
1
|
0
|
正常に開始されました | 電源モジュールは、シャットダウンを引き起こすイベントが回復した場合、シャットダウン状態から再起動できます。電源モジュールが正常に起動したら、このビットを1に設定してください。このビットに1を書き込むことで、システムソフトウェアによってクリアできます。このフラグは、解決されたイベントが発生したことをコントローラに通知します。この情報は、再起動によってすべてのステータスとアラームフラグがクリアされ、電源から送信された割り込みがコントローラのサービスに対して未解決のままである可能性があるため、有用です。 | 情報のみ。必要な操作はありません。 |
0
|
0
|
ピンHIを有効にする | ハードウェアイネーブル信号がHIであるため、電源はシャットダウンされます。 | PSUは内部で接地されており、PSUスイッチがオフの場合に想定されます。PSUスイッチがオンの場合は、スイッチを切り替えます。PSUを交換します。 |
ビット | デフォルト値 | ビット名 | コメント | 推奨処置 |
---|---|---|---|---|
7
|
0
|
内部障害 | 内部診断に失敗しました。 | 潜在的な表面的な問題のみ(Cisco Bug ID CSCty78612を参照してください)。 PSUをリセットします。PSUを交換します。 |
6
|
0
|
電源再投入発生 | 次の条件で制御シャットダウンが発生した場合、1にラッチします。 1)電源サイクルビットレジスタ40ビット5が設定されている |
情報のみ。必要な操作はありません。 |
5
|
0
|
50 V 2過電流シャットダウン | 50V出力2が定格電流を超えたため、電源がシャットダウンしました。 | AC入力を確認します。PSUをリセットします。 |
4
|
0
|
50V 1過電流シャットダウン | 50V出力1が定格電流を超えたため、電源がシャットダウンしました。 | AC入力を確認します。PSUをリセットします。 |
3
|
0
|
3.4V過電流シャットダウン | 3.4V出力が定格電流を超えたため、電源がシャットダウンしました。 | AC入力を確認します。PSUをリセットします。 |
0
|
0
|
50V 2過電圧遮断 | 50V出力2が定格電圧を超えたため、電源がシャットダウンしました。 | AC入力を確認します。PSUをリセットします。 |
1
|
0
|
50V 1過電圧遮断 | 50V出力1が定格電圧を超えたため、電源がシャットダウンしました。 | AC入力を確認します。PSUをリセットします。 |
0
|
0
|
3.4V過電圧遮断 | 3.4V出力が定格電圧を超えたため、電源がシャットダウンしました。 | AC入力を確認します。PSUをリセットします。 |
ビット | デフォルト値 | ビット名 | コメント | 推奨処置 |
---|---|---|---|---|
7
|
0
|
ファン障害 | ラッチ1:ファンの速度が通常の動作速度の70%を下回った場合。ファンの障害状態のため、電源モジュールはシャットダウンしません。 | ファンの障害物をチェックします。PSUを交換します。 |
6
|
0
|
温度センサーの障害 | 温度センサーの1つが故障しています。 | PSUを交換します。 |
5
|
0
|
温度に対して2をブーストshutdown | ブースト2過熱状態のため、電源がシャットダウンしました。 | 環境を確認します。 |
4
|
0
|
Boost 1 over temp.shutdown | ブースト1過熱状態のため、電源がシャットダウンしました。 | 環境を確認します。 |
3
|
0
|
50 V 2 over temp.shutdown | 50V出力2過熱状態のため、電源がシャットダウンしました。 | 環境を確認します。 |
0
|
0
|
50 V 1 over temp.shutdown | 50V出力1過熱状態のため、電源がシャットダウンしました。 | 環境を確認します。 |
1
|
0
|
3.4 V以上の温度shutdown | 3.4Vの出力過熱状態のため、電源がシャットダウンしました。 | 環境を確認します。 |
0
|
0
|
過温度警告 | サーマルシャットダウンイベントの5秒前に発行されました。 | 環境を確認します。 |
ビット | デフォルト値 | ビット名 | コメント | 推奨処置 |
---|---|---|---|---|
7
|
0
|
強制的にシャットダウン | 電源ノブのキーを使用して電源をシャットダウンすると、このビットはロジック1になります。それ以外の場合は、ロジック0になります。 | 情報のみ。必要な操作はありません。 |
6
|
0
|
未使用 | ||
5
|
0
|
未使用 | ||
4
|
0
|
入力モードの変更 | AC1またはAC2の入力モードが変化すると、このビットは1に設定されます。 | 情報のみ。必要な操作はありません。 |
3
|
0
|
現在の共有障害 | 2つのモジュールが現在の共有に失敗すると、このビットは1に設定されます。 | PSUをリセットします。PSUを交換します。 |
0
|
0
|
50Vモジュール2(電圧下) | モジュール2の50V出力が定格電圧を下回りました。AC2がオンの場合にのみアラームを発生させます。 | PSUを交換します。 |
1
|
0
|
50Vモジュール1の電圧下 | モジュール1の50V出力が定格電圧を下回りました。AC1がオンの場合にのみアラームを発生させます。 | PSUを交換します。 |
0
|
0
|
3.4V(低電圧時) | 3.4Vの出力は、定格電圧以下に低下した。 | PSUを交換します。 |
このドキュメント全体で使用されている例で説明されている情報から、レジスタ2、ビット7の設定で電源ファンに障害が発生していることがわかります。ファンに障害物がないかチェックしましたが(表で推奨)、何も見つかりませんでした。その後、PSUはReturn Material Authorization(RMA)で交換されました。
改定 | 発行日 | コメント |
---|---|---|
1.0 |
21-May-2015 |
初版 |