このリストは、事前設定されたCallManagerアラートで構成されています。
- BeginThrottlingCallListBLFSubscriptions
- CallAttemptBlockedByPolicy
- CallProcessingNodeCpuPegging
- CARIDSEngineCritical
- CARIDSEngineFailure
- CARSchedulerJobFailed
- CDRAgentSendFileFailed
- CDRFileDeliveryFailed
- CDRHighWaterMarkExceeded
- CDRMaximumDiskSpaceExceeded
- CodeYellow
- DBChangeNotifyFailure
- DBReplicationFailure
- DBReplicationTableOutofSync
- DDRBlockPrevention
- DDRDown
- EMCCFailedInLocalCluster
- EMCCFailedInRemoteCluster
- ExcessiveVoiceQualityReports
- IMEDistributedCacheInactive
- IMEOverQuota
- IMEQualityAlert
- InsufficientFallbackIdentifier
- IMEServiceStatus
- InvalidCredentials
- LowTFTPServerHeartbeatRate
- MaliciousCallTrace
- MediaListExhausted
- MgcpDChannelOutOfService
- NumberOfRegisteredDevicesExceeded
- NumberOfRegisteredGatewaysReduced
- NumberOfRegisteredGatewaysIncreased
- NumberOfRegisteredMediaDevicesReduced
- NumberOfRegisteredMediaDevicesIncreased
- NumberOfRegisteredPhonesDropped
- RouteListExhausted エラー
- SDLLinkOutOfService
- TCPSetupToIMEFailed
- TLSConnectionToIMEFailed
- UserInputFailure
LowAvailableVirtualMemoryおよびLowSwapPartitionAvailableDiskSpace
Linuxサーバは、一定期間の仮想メモリの使用状況を「明確にできない」傾向があり、その結果、アラートが蓄積されることが確認されています。
Linuxの動作は、オペレーティングシステムとは少し異なります。
メモリがプロセスに割り当てられると、他のプロセスが使用可能なメモリ以上のメモリを要求しない限り、プロセッサはメモリを取り戻しません。
これにより、仮想メモリが多くなります。
より高いバージョンのcall managerでアラームのしきい値を増やす要求は、不具合(https://bst.cloudapps.cisco.com/bugsearch/bug/CSCuq75767/?reffering_site=dumpcr)に記載されています。
スワップパーティションの場合、このアラートは、スワップパーティションの空き容量が少なく、システムによって頻繁に使用されていることを示します。通常、スワップパーティションは、必要に応じて物理RAM容量を拡張するために使用されます。通常の状態では、RAMが十分であれば、スワップを過度に使用しないでください。
また、これらは一時ファイルの蓄積が原因でRTMTアラートをスローする可能性があります。不要な一時ファイルを消去するには、サーバの再起動を推奨します。
LogPartitionHighWaterMarkExceededおよびLogPartitionLowWaterMarkExceeded
CUCMサーバのCLIでshow statusを実行すると、CUCMディスク領域のロギングパーティションの占有割合と空き割合を指定する値が表示されます。共通パーティションとも呼ばれ、これらの値は、ログ/トレースおよびサーバのCDRファイルが占有する領域を指定します。これは無害ですが、インストール/アップグレード手順で時間の経過に伴うスペースの不足により問題が発生する可能性があります。これらのアラートは、クラスタ/サーバで時間の経過とともに蓄積したログをクリアするための警告として管理者に役立ちます。
LogPartitionLowWaterMarkExceeded:このアラートは、埋め込まれた領域がアラートに設定されているしきい値に達した場合に生成されます。このアラートは、ディスク使用率のプレチェックインジケータとして機能します。
LogPartitionHighWaterMarkExceeded:このアラートは、埋め込まれた領域がアラートに設定されているしきい値に達すると生成されます。アラートが生成されると、サーバは最も古いログの自動消去を開始し、HighWaterMarkしきい値に達した値にスペースを縮小します。
ベストプラクティスは、LogPartitionLowWaterMarkExceededアラートを受信した直後に、ログを手動で消去することです。
次の手順を実行します。
ステップ1:RTMTを起動します。
ステップ2:[Alert Central]を選択し、次のタスクを実行します。
[LogPartitionHighWaterMarkExceeded]を選択し、その値をメモし、しきい値を60%に変更します。
[LogPartitionLowWaterMarkExceeded]を選択し、その値をメモし、しきい値を50%に変更します。
ポーリングは5分ごとに行われるため、5 ~ 10分待ってから、必要なディスク領域が使用可能であることを確認します。共通パーティションの空きディスク領域を増やす場合は、LogPartitionHighWaterMarkExceededスレッド値とLogPartitionLowWaterMarkExceeededスレッド値を小さい値(30 %と20 %)に変更してください。
共通パーティションのスペースをクリアするために15 ~ 20分を与えます。CLIからコマンドshow statusを使用して、ディスク使用率の減少を監視できます。
これで共通区画がダウンします。
CpuPegging
CpuPeggingアラートは、設定されたしきい値に基づいてCPU使用率を監視します。
CPUペギングのアラートを受信すると、最も高いCPUを占有するプロセスは、左側の[システム(System)]ドロワーの[プロセス(Process)]に移動して占有できます。
関連するサーバのCLIから、これらの出力は何らかの情報を提供します。
- utils diagnose test
- show process load cpu sorted
- show status
- utils core active list
CPUスパイクが特定の時間に発生するか、ランダムに発生するかを確認することをお勧めします。ランダムに発生した場合は、必要な詳細なCUCMトレースとRisDC perfmonログを調べて、CPUのスパイクを引き起こしている原因を確認します。特定の時刻にアラートが発生している場合、ディザスタリカバリシステム(DRS)バックアップやCDRロードなどのスケジュールされたアクティビティが原因である可能性があります。
また、どのプロセスが最も多くのCPUを占有しているかに関する情報に基づいて、特定のログを取得して詳細に調査します。例:問題の原因がTomcatの場合は、Tomcat関連のログが必要です。