概要
このドキュメントでは、Unified Computing System Manager(UCSM)3.1.3aリリースで導入されたData Management Engine(DME)データベース(DB)に関連する機能について説明します。
前提条件
要件
次の項目に関する知識があることが推奨されます。
使用するコンポーネント
このドキュメントの情報は、次のソフトウェアとハードウェアのバージョンに基づいています。
- UCSMソフトウェアバージョン3.1.3a
- Fabric Interconnect(FI)6200シリーズおよび6332モデル
このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されました。このドキュメントで使用するすべてのデバイスは、初期(デフォルト)設定の状態から起動しています。本稼働中のネットワークでは、各コマンドによって起こる可能性がある影響を十分確認してください。
背景説明
DMEは、システム状態情報を保持するUCSMソフトウェアアーキテクチャの中心的なコンポーネントです。情報は次の場所に保存されます。
DME DBと呼ばれる組み込みデータベース形式のローカルストレージFIデバイス。
ストレージ・ハードウェア・デバイスの障害により、データベース内のデータ整合性が破損する可能性があります。UCSM 3.1.3aリリースでは、多くの新機能が
は、定期的なDBヘルスチェックを使用してUCSMの復元力を高め、破損したDBのシームレスな回復と、DME DBの自動バックアップによるデータ保護を実現するために追加されています。
UCSM DMEデータベースのヘルスチェック機能
定期的なデータベースのヘルスチェック
UCS Managerは、定期的な間隔でDBのヘルスチェックを開始し、データの整合性を検証します。
システムでは、ユーザが手動でヘルスチェックを実行し、DBの整合性を確認することもできます。
デフォルト設定の確認
デフォルトでは、ヘルスチェックは12時間ごとに実行され、現在のステータスを表示するには、次のコマンドを使用します。
UCS # scope system
UCS /system # show mgmt-db-check-policy detail
Management Database Integrity Check Policy:
Health Check Interval (hours): 12
Last Integrity Check Time: 2017-05-07T14:42:47.019
Internal Backup Interval (days): 14
Last Internal Backup Time: 2017-04-28T14:52:12.648
UCS /system #
間隔の変更
時間間隔を変更したり、ヘルスチェックを無効にしたりできますが、デフォルト設定を変更しないことを強く推奨します。
注意:これらの値をデフォルトから変更しないことを強く推奨します
この例では、間隔が12時間から48時間に変更されています。
UCS /system # set mgmt-db-check-policy health-check-interval 48
UCS /system* # commit-buffer
UCS /system # show mgmt-db-check-policy detail
Management Database Integrity Check Policy:
Health Check Interval (hours): 48
Last Integrity Check Time: 2017-05-07T14:42:47.019
Internal Backup Interval (days): 14
Last Internal Backup Time: 2017-04-28T14:52:12.648
ヘルスチェックを無効にするには、値を0に設定します。
手動でヘルスチェックを実行する
DBヘルスチェックを確認するには、次のコマンドを実行します。端末にメッセージが出力されない場合、DBは正常です。
UCS # scope system
UCS /system # start-db-check
UCS /system* # commit-buffer
さらに、すべてのエラーメッセージがプライマリFI DMEログファイル(UCSM techsupportバンドルの一部)に記録されます。
[prt:executeHealthCheck] Health Check complete with no corruption
このコマンドを使用すると、DBステータスをさらに確認できます。
UCS # scope system
UCS /system # show mgmt-db
Management Database Status:
Fabric Id Corrupted Count Last Occurrence Time
--------- ----------------------- --------------------
A 0 1970-01-01T00:00:00.000
B 0 1970-01-01T00:00:00.000
DBの破損:ユーザレベルの障害および回復メカニズム
ヘルスチェック中にUCSMがDBの破損を検出すると、障害メッセージが生成されます。
INFOレベルの障害は、1回の発生時に発生し、破損が複数回発生した場合に発生します。MAJORレベルの障害がログに記録されるため、さらに対処してCisco TACに連絡する必要があります。techsupportバンドルを収集します。
ucs /system # show fault
Severity Code Last Transition Time ID Description
--------- -------- ------------------------ -------- -----------
Info F1899 2017-04-28T01:09:23.332 263649 Management database corruption detected and recovered on Fabric Interconnect B. Number of corruption events: 1. Last corruption event timestamp: 2017-04-28T01:09:23.332
Major F1900 2017-05-02T00:52:07.846 263651 High number of management database corruption events on Fabric Interconnect A. Number of corruption events: 3. Last corruption event timestamp: 2017-05-02T01:06:06.387
回復メカニズム
UCSMは、サービスやデータプレーントラフィックに影響を与えることなく自動的に破損を解決し、メモリのDBを上書きするか、ピアFIから適切なDBをコピーします。
破損イベント |
システム回復メカニズム |
プライマリFI |
データベースはメモリ管理情報ツリー( MIT )からリカバリされます。 |
下位FI |
データベースファイルがプライマリFIから取得されます |
破損カウントのリセット
DBの破損は、手動でクリアされるまで続きます。たとえば、FIハードウェアが破損を解決するためにさらに調査に基づいて交換された場合、このコマンドを実行して破損の障害数をリセットできます。
ucs-A # scope system
ucs-A /system # set mgmt-db-check-policy reset-corruption-count yes
ucs-A /system* # commit-buffer
定期バックアップ
データ保護を最大限に高めるために、UCSMは2週間ごとにUCSM設定(DME DB)の完全な状態バックアップを取り、リカバリに使用できます。
さらに、バックアップが良好な状態からの設定を含むように、DB整合性チェックが検証されます。
フル状態のバックアップファイルは、各FIの/workspace/backupディレクトリに保存されます。
UCS # connect local-mgmt
UCS(local-mgmt)# dir backup/
1 1823454 Apr 28 14:53:23 2017 internalBackup.1493391132.tgz
バックアップジョブ間隔の変更
バックアップジョブの頻度は1日から60日に変更できます。この例に示すように、値を28日に変更しました。
UCS # scope system
UCS /system # set mgmt-db-check-policy internal-backup-interval 28
UCS /system* # commit-buffer
UCS /system # show mgmt-db-check-policy detail
Management Database Integrity Check Policy:
Health Check Interval (hours): 24
Last Integrity Check Time: 2017-05-10T10:35:24.909
Internal Backup Interval (days): 28
Last Internal Backup Time: 2017-04-28T14:52:12.648
UCS /system #
関連情報