简介
本文档介绍可用于检查和监控9800状态并主动识别任何可能问题的命令列表。
监控KPI
性能指示符分为多个类别,本文档包括以下类别:
- 常规WLC(无线LAN控制器)KPI:检查WLC状态、崩溃、CPU和内存利用率
- AP KPI:AP断开、崩溃、配置错误标记
- 无线客户端相关KPI:客户端状态分布、客户端删除原因、RADIUS故障
- RF统计信息:AP信道/发射功率分配、负载、信道更改、DFS事件
- 数据包丢弃并传送到CPU:检查丢弃、数据包被传送、缓冲区故障、数据路径利用率
- 与其他WLC、DNAC或DNAS的连接:使用DNAC或DNAS检查移动性和连接
- 自动进行KPI的数据收集:如何实现KPI数据收集的自动化,如何进行定期收集。
常规WLC KPI
- 检查WLC的运行时间和版本,并确认WLC处于安装模式
show version | i正常运行时间|安装模式|Cisco IOS软件
显示冗余 | i ptime|位置|当前软件状态|切换
虚拟WLC和9800-L:
!!Active
dir bootflash:/core/ | i core|system-report
!!Standby
dir stby-bootflash:/core/ | i core|system-report
- 检查 CPU 使用率:确定是否存在使用大量CPU的进程。
sh processes cpu platform sorted | ex 0% 0% 0%
注意:对于9800-CL和9800-L,我们可以将ucode_pkt_PPE0中的cpu使用率较高视为预期行为。
show processes cpu platform sorted | i wncd
- 检查内存利用率:确定设备是否耗尽内存以及是否存在一些内存占用的进程。
show platform resources(basic)
show process memory platform sorted
show processes memory platform accounting(advanced)
show platform
show inventory
show environment(仅适用于物理9800-40、9800-80和9800-L)
show license summary | i状态:
监控接入点KPI
show ap summary | i AP数量
- 检查AP重新加载或capwap重新启动。确定具有更低的“AP运行时间” — >重新加载或更低的“关联运行时间” — > capwap重新启动的AP
show ap uptime | ex ____([0-9])+天
注意:重点关注1天内重新加载或重新启动的AP
show ap crash
show wireless stats ap session termination
show wireless stats ap history | i已断开
show ap tag summary | i是
show ap sum sort descending client-count | i __0_
无线客户端相关的KPI
show wireless summary
show wireless stats client detail | i身份验证:|移动性:|IP学习:|Webauth挂起:|运行:|正在删除:
show wireless stats client delete reasons | e :0
show wireless stats trace-on-failure
- 检查RADIUS故障、访问拒绝、未响应的数据包、长队列
show radius statistics
show aaa servers | i Platform Dead:total|RADIUS:ID
RF统计信息
show ap dot11 5ghz summary
show ap dot11 24ghz summary
show ap dot11 6ghz summary
show ap auto-rf dot11 5ghz | i由于雷达引起的信道更改|AP名称|信道更改计数
show ap auto-rf dot11 24ghz | i信道更改计数|AP名称
- 检查信道利用率和客户端数量。识别客户端数量较少且信道利用率较高的AP。
show ap dot11 5ghz load-info
show ap dot11 24ghz load-info
show ap dot11 6ghz load-info
数据包丢弃并传送到CPU
show int po1 | i线路协议|放置速率|丢弃|广播
show platform hardware chassis active qfp statistics drop
show platform hardware chassis active qfp feature wireless punt statistics
show buffers | i缓冲区|失败
show platform hardware chassis active qfp datapath utilization | i加载
监控与其他WLC、DNAC或DNAS的连接
- 检查移动性,确认移动性隧道已启用且使用正确的PMTU
show wireless mobility summary
show telemetry internal connection or show telemetry connection all after 17.7.1
show nmsp status
自动收集KPI数据
有一个脚本使用guestshell收集和存储输出:https://developer.cisco.com/docs/wireless-troubleshooting-tools/#9800-guestshelleem-scripts-9800-guestshelleem-scripts
您还可以使用EEM在每次特定时间运行guestshell脚本:
周一至周五23:59收集KPI:
事件管理器小程序KPI
event timer cron cron-entry "59 23 * 1-5" maxrun 600
action 1.0 cli命令“enable”
action 2.0 cli命令"guestshell run python3 /bootflash//guest-share/KPI.py"
action 3.0 cli命令"end"