소개
이 문서에서는 UCSM(Unified Computing System Manager) 3.1.3a 릴리스에 도입된 DME(Data Management Engine) 데이터베이스(DB)와 관련된 기능에 대해 설명합니다.
사전 요구 사항
요구 사항
다음 주제에 대한 지식을 보유하고 있으면 유용합니다.
사용되는 구성 요소
이 문서의 정보는 다음 소프트웨어 및 하드웨어 버전을 기반으로 합니다.
- UCSM 소프트웨어 버전 3.1.3a
- Fabric Interconnect(FI) 6200 Series 및 6332 모델
이 문서의 정보는 특정 랩 환경의 디바이스를 토대로 작성되었습니다.이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다.네트워크가 작동 중인 경우 모든 명령의 잠재적인 영향을 이해해야 합니다.
배경 정보
DME는 시스템 상태 정보를 포함하는 UCSM 소프트웨어 아키텍처의 중앙 구성 요소입니다.정보는
DME DB라고 하는 내장형 데이터베이스의 형태로 로컬 스토리지 FI 디바이스.
스토리지 하드웨어 장치 장애로 인해 데이터베이스의 데이터 무결성이 손상될 수 있습니다.UCSM 3.1.3a 릴리스에서는 새로운 기능이 많이 추가됨
DME DB의 자동 백업을 통해 손상된 DB를 원활하게 복구하고 데이터를 안전하게 보호하면서 정기적인 DB 상태 검사를 사용하여 UCSM의 복원력을 높일 수 있습니다.
UCSM DME 데이터베이스 상태 확인 기능
정기 데이터베이스 상태 확인
UCS Manager는 정기적으로 DB의 상태 검사를 시작하여 데이터의 무결성을 검증합니다.
또한 사용자가 수동으로 상태 검사를 실행하고 DB 무결성을 확인할 수 있습니다.
기본 구성 확인
기본적으로 상태 확인은 12시간마다 수행되며, 현재 상태에서는 다음 명령을 사용합니다.
UCS # scope system
UCS /system # show mgmt-db-check-policy detail
Management Database Integrity Check Policy:
Health Check Interval (hours): 12
Last Integrity Check Time: 2017-05-07T14:42:47.019
Internal Backup Interval (days): 14
Last Internal Backup Time: 2017-04-28T14:52:12.648
UCS /system #
간격 변경
시간 간격을 수정하거나 상태 검사를 비활성화할 수 있지만 기본 컨피그레이션을 변경하지 않는 것이 좋습니다.
주의:이러한 값은 기본값에서 변경하지 않는 것이 좋습니다
이 예에서는 간격이 12시간에서 48시간으로 변경됩니다.
UCS /system # set mgmt-db-check-policy health-check-interval 48
UCS /system* # commit-buffer
UCS /system # show mgmt-db-check-policy detail
Management Database Integrity Check Policy:
Health Check Interval (hours): 48
Last Integrity Check Time: 2017-05-07T14:42:47.019
Internal Backup Interval (days): 14
Last Internal Backup Time: 2017-04-28T14:52:12.648
상태 검사를 비활성화하려면 값을 0으로 설정합니다.
상태 검사를 수동으로 실행
DB 상태 검사를 확인하려면 이러한 명령을 실행할 수 있습니다.터미널에 메시지가 인쇄되지 않으면 DB가 정상입니다.
UCS # scope system
UCS /system # start-db-check
UCS /system* # commit-buffer
또한 모든 오류 메시지가 기본 FI DME 로그 파일(UCSM techsupport 번들의 일부)에 기록됩니다.
[prt:executeHealthCheck] Health Check complete with no corruption
이 명령을 사용하면 DB 상태를 추가로 확인할 수 있습니다.
UCS # scope system
UCS /system # show mgmt-db
Management Database Status:
Fabric Id Corrupted Count Last Occurrence Time
--------- ----------------------- --------------------
A 0 1970-01-01T00:00:00.000
B 0 1970-01-01T00:00:00.000
DB 손상 - 사용자 수준 오류 및 복구 메커니즘
UCSM이 상태 확인 중에 DB에서 손상을 탐지하면 결함 메시지가 생성됩니다.
INFO 레벨 결함은 한 번 발생한 경우 생성되며 손상이 두 번 이상 발생한 경우 MAJOR 레벨 결함이 기록되며 추가 조치를 취하고 Cisco TAC에 문의해야 합니다.기술 지원 번들을 수집합니다.
ucs /system # show fault
Severity Code Last Transition Time ID Description
--------- -------- ------------------------ -------- -----------
Info F1899 2017-04-28T01:09:23.332 263649 Management database corruption detected and recovered on Fabric Interconnect B. Number of corruption events: 1. Last corruption event timestamp: 2017-04-28T01:09:23.332
Major F1900 2017-05-02T00:52:07.846 263651 High number of management database corruption events on Fabric Interconnect A. Number of corruption events: 3. Last corruption event timestamp: 2017-05-02T01:06:06.387
복구 메커니즘
UCSM은 서비스 또는 데이터 플레인 트래픽에 영향을 주지 않고 손상을 자동으로 해결하고 메모리에서 DB를 덮어쓰거나 피어 FI에서 좋은 DB를 복사합니다.
손상 이벤트 |
시스템 복구 메커니즘 |
기본 FI |
MIT(메모리 관리 정보 트리)에서 데이터베이스가 복구됨 |
하위 FI |
데이터베이스 파일이 기본 FI에서 검색됨 |
손상 수 다시 설정
DB 손상은 수동으로 제거될 때까지 유지됩니다.예를 들어 손상을 해결하기 위해 추가 조사를 통해 FI 하드웨어를 교체한 경우 이 명령을 실행하여 손상 결함 수를 재설정할 수 있습니다.
ucs-A # scope system
ucs-A /system # set mgmt-db-check-policy reset-corruption-count yes
ucs-A /system* # commit-buffer
정기 백업
UCSM은 데이터 보호를 극대화하기 위해 2주에 한 번씩 UCSM 구성(DME DB)의 전체 상태 백업을 수행하며, 이는 복구 용도로 사용할 수 있습니다.
또한 DB 무결성 검사가 검증되어 백업에 정상 상태의 컨피그레이션이 포함됩니다.
전체 상태 백업 파일은 각 FI의 /workspace/backup 디렉토리에 저장됩니다.
UCS # connect local-mgmt
UCS(local-mgmt)# dir backup/
1 1823454 Apr 28 14:53:23 2017 internalBackup.1493391132.tgz
백업 작업 간격 변경
백업 작업의 빈도를 1일에서 60일로 변경할 수 있습니다.이 예와 같이 값을 28일로 변경했습니다.
UCS # scope system
UCS /system # set mgmt-db-check-policy internal-backup-interval 28
UCS /system* # commit-buffer
UCS /system # show mgmt-db-check-policy detail
Management Database Integrity Check Policy:
Health Check Interval (hours): 24
Last Integrity Check Time: 2017-05-10T10:35:24.909
Internal Backup Interval (days): 28
Last Internal Backup Time: 2017-04-28T14:52:12.648
UCS /system #
관련 정보