简介
本文档介绍对Nexus 3000/9000和7000平台执行自动运行状况和配置检查的过程和要求。
先决条件
要求
只有运行独立NX-OS软件的Nexus平台才支持自动运行状况和配置检查,而不支持运行ACI软件的交换机。
支持以下硬件平台:
- 运行统一NX-OS软件映像的Nexus 3000/9000系列交换机:7.0(3)Ix或更高版本
- 运行NX-OS软件7.x或更高版本的Nexus 7000/7700系列交换机
使用的组件
本文档不限于特定的软件和硬件版本。
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您的网络处于活动状态,请确保您了解所有命令的潜在影响。
规则
有关文档规则的详细信息,请参阅 Cisco 技术提示规则。
运行状况和配置检查过程
请从 show tech-support details
Nexus交show tech-support
换机收集或日志,以便对其执行运行状况和配置检查。强烈建议show tech-support details
,因为它通过执行更多检查可提供更高的值。请确保以.txt或.gz/.tar格式捕获日志。目前show tech-support
show tech-support details
,支持以ASCII和UTF-8文本格式捕获的或文件。
在思科支持案例管理器上使用下列一组关键字(技术/子技术/问题代码)提交常规TAC服务请求:
技术:数据中心和存储网络
子技术:(选择适当的平台)
Nexus 3000(仅限N3000系列) — 运行状况和配置检查(自动)
Nexus 3000(N3100-N3600系列) — 运行状况和配置检查(自动)
Nexus 7000系列交换机 — 运行状况和配置检查(自动)
Nexus 9200 — 运行状况和配置检查(自动)
Nexus 9300(非EX/FX/GX/R系列) — 运行状况和配置检查(自动)
Nexus 9300(EX/FX/GX/R系列) — 运行状况和配置检查(自动)
Nexus 9400系列交换机 — 运行状况和配置检查(自动)
Nexus 9500(非EX/FX/GX/R系列) — 运行状况和配置检查(自动)
Nexus 9500(EX/FX/GX/R系列) — 运行状况和配置检查(自动)
Nexus 9800系列交换机 — 运行状况和配置检查(自动)
问题代码:运行状况和配置检查
SR打开后,思科指导工作流将引导您完成上传或日志 show tech-support details
的show tech-support
步骤。
上传所需的输出后,思科会分析日志并提供运行状况检查报告(PDF格式),该报告会附加到发送给用户的电子邮件中。该报告包含检测到的问题的列表、排除问题的相关步骤以及建议的行动计划。
如果对报告的运行状况检查失败存在疑问,建议用户打开包含适当关键字的单独服务请求,以获得进一步的专家帮助。强烈建议参考为自动运行状况和配置检查打开的服务请求(SR)编号以及生成的报告,以加快调查速度。
运行状况和配置检查模块
自动Nexus运行状况和配置检查版本1(2022年8月版本)执行表1中列出的检查。
表 1:运行状况检查模块和模块使用的关联CLI
索引 |
运行状况检查模块
|
单元简要说明 |
用于执行运行状况检查的CLI
|
1. |
NX-OS版本检查 |
检查设备是否运行思科推荐的NX-OS软件版本 |
show version |
2. |
Nexus EoS/EoL产品检查 |
验证任何组件(硬件/软件)是否已达到寿命终止(EOL)或销售终止(EOS) |
show version show module show inventory |
3. |
现场通知检查 |
检查设备是否可能受到已知PSIRT/CVE或Field Notice的影响。 |
show version show module show inventory show running-config 以及根据给定FN/PSIRT检查文件所需的任何命令。 |
4. |
NX-OS CPU运行状况检查 |
检查症状CPU使用率是否提高。当当前/历史CPU使用率超过60%时会报告此情况。 |
show processes cpu show processes cpu sort show processes cpu history show system resources |
5. |
NX-OS内存运行状况检查 |
检查设备上的内存使用率是否超过系统内存阈值(默认值或用户配置的值)。 |
show version show processes memory show system resources |
6. |
NX-OS接口检查 |
检查所报告的任何接口是否在RX或TX方向上丢弃。模块在每个方向上打印5个具有最高错误率的接口。 |
show interface show interface brief show queuing |
7. |
CoPP运行状况检查 |
检查CoPP是否被禁用或配置不正确(例如,所有符合默认类的CPU绑定的流量),或者是否具有过时的CoPP策略(例如,从旧版本继续传输),或者,非默认类中报告的丢弃数是否超过1000。 |
show copp status show policy-map interface control-plane show running-config |
8. |
进程间通信(MTS)运行状况检查 |
检测是否存在任何滞留超过1天的进程间通信(称为MTS)消息。 |
show system internal mts buffer summary show system internal mts buffer details |
9. |
Nexus模块运行状况检查 |
检查是否有任何模块(线路卡、交换矩阵等)报告诊断故障或处于关闭/故障状态 |
show module show inventory show diagnostic result module all detail |
10. |
PSU和风扇运行状况检查 |
检测是否有任何电源未处于运行状态。 |
show inventory show environment
show logging log show logging nvram
|
11. |
vPC最佳实践检查 |
验证设备配置是否符合vPC最佳实践,例如对等路由器、对等交换机和对等网关配置。 |
第3层对等路由器:
show running-config (检查是否已形成OSPF、EIGRP和BGP邻接关系) 对等网关/对等交换机: show running-config show spanning-tree show vpc brief show interface brief |
12. |
MTU 检查 |
检测不一致的MTU配置,如第2层接口和第3层SVI的MTU配置不匹配、OTV加入接口上的MTU不正确或在需要它的接口上未启用巨型MTU等。 |
show running-config show interface show ip arp
show mac address-table show ip route detail
show ip eigrp neighbors
show ip ospf neighbors
show bgp
|
13. |
第2层功能配置运行状况检查 |
检查是否启用了L2功能但未使用
|
show running-config |
14. |
NX-OS vPC兼容性检查 |
检查虚拟端口通道(vPC)是否报告了type1/type 2不兼容错误。 |
show running-config show vpc
|
15. |
生成树协议运行状况检查 |
检查连接的输出,查找生成树协议不稳定或处于意外状态的指示。模块报告最近发生拓扑更改的vlan以及一些其他信息: 时间戳、接口和根网桥ID。 目前,此运行状况检查模块仅支持RSTP;计划在未来的版本中支持MST。 |
show spanning-tree detail show spanning-tree internal errors show spanning-tree internal event-history
show spanning-tree active show logging log
show mac address-table notification mac-move
show system internal
|
16. |
PortChannel运行状况检查 |
检测任何已配置的端口通道成员是否处于不正常状态:(I)、(s)(D)或(H) |
show port-channel summary |
17. |
SFP验证检查 |
检测报告“SFP验证失败”错误的任何收发器 |
show interface brief |
18. |
第3层功能配置运行状况检查 |
检查是否启用了任何L3功能但未使用 |
show running-config |
19. |
通过管理VRF检查的默认路由 |
检查设备是否具有通过管理vrf在默认vrf中配置的默认路由。 |
show running-config show accounting log |
20. |
不支持的vPC组播路由检查 |
检查vPC上不受支持的PIM邻接关系 |
show running-config show ip pim interface vrf all internal show ip pim neighbor vrf all detail |
21. |
OSPF运行状况检查 |
检查设备上观察到的可能邻接问题。例如:
- 在配置为P2P的接口上检测到多个邻居
- 未手动配置或使用环回IP的路由器ID
- 邻接关系未处于FULL状态
- 最近达到FULL状态的邻接关系并指示潜在的不稳定性
|
show running-config show ip interface brief vrf all show ip ospf neighbors detail vrf all private show ip ospf interface vrf all private show logging log |
22. |
EIGRP运行状况检查 |
检查设备上观察到的可能邻接问题。例如:
- 未配置AS编号
- 未检测到活动邻居
- 检测到高值SRTT、RTO或Q Cnt
- 检测到大量丢弃的EIGRP数据包
- 邻接正常运行时间小于15分钟,表示存在潜在的不稳定性
- 最近7天邻接关系断开
|
show running-config show logging log show ip eigrp neighbors detail vrf all show ip eigrp detail vrf all |
23. |
BGP对等体运行状况检查 |
检查处于IDLE状态的BGP邻接关系。 |
show running-config show bgp vrf all all summary |
24. |
第一跳冗余协议(FHRP) |
检查非默认计时器配置,因为这些配置可能会导致性能不佳。 此运行状况检查模块仅涵盖热备份路由协议(HSRP) |
show running-config |
25. |
VXLAN EVPN配置一致性检查器 |
根据《NX-OS VXLAN配置指南》检查连接的配置输出。 例如,验证:
- 用作NVE源的环回接口和用作源BGP更新的环回接口不同
- 用作NVE源的环回接口在默认VRF中
- VXLAN封装的流量L3上行链路处于默认VRF中,未配置为SVI或子接口。
- 第3层上行链路具有一个ARP条目(即无多路访问)。
- 功能vPC已启用且存在vPC域
- 备份SVI处于默认VRF中,允许通过vPC对等链路并定义为基础VLAN。
- 两个vPC对等设备的NVE状态管理状态为UP(vPC一致性参数)
- 为每个L2 VNI配置“ingress-Replication”或“mcast-group”,或者在NVE下定义“global mcast-group”
- 在第3层上行链路上启用PIM稀疏模式如果组播用作BUM流量的复制模式
- 在第3层上行链路上启用PIM稀疏模式,不使用“evpn multisite dci-tracking”
- “suppress-arp”仅配置在扩展VLAN的SVI配置了“交换矩阵转发模式任播网关”的L2VNI上
- 在早于9.2的NX-OS版本上配置了“advertise l2vpn evpn”
- multisite仅在具有云级ASIC的Nexus 9000上配置
- 在DCI链路上配置了“evpn multisite dci-tracking”,在第3层上行链路上配置了“fabric-tracking”,并且该接口不是SVI
- 在BGW之间的L2VPN会话上配置了“peer-type fabric-external”
- 在NVE上定义用作多站点源的环回接口
- vPC域下配置了“peer-gateway”、“peer-switch”、“ip arp synchronize”、“ipv6 nd synchronize”
- 为L3VNI配置了“associate-vrf”,并且L3VNI的SVI具有VN段
- 与远程BGW的L2VPN EVPN邻接具有“peer-type fabric-external”和“rewrite-evpn-rt-asn”
|
show running-config show version show module
show inventory show vpc show port-channel summary show vlan all-ports |
报告和警告
- 运行状况和配置检查SR由虚拟TAC工程师自动处理。
- 报告(采用PDF格式)通常在24个工作小时内生成并附加到SR的所有必要的日志。
- 报告通过电子邮件(源自jhwatson@cisco.com)与服务请求相关的所有联系人(主要和辅助)自动共享。
- 此报告也会附加到Service Request中,以便以后随时可用。
- 请注意,报告中列出的问题基于提供的日志,并且属于前面表1中列出的运行状况检查模块的范围。
- 所执行的运行状况和配置检查列表并非详尽无遗,建议用户根据需要执行进一步的运行状况检查。
- 对于具有多个虚拟设备环境(VDC)的Nexus 7000,需要从每个VDC获取一个show tech-support details文件以获得最佳结果。
- 对于VxLAN EVPN,不执行下一检查:
- 针对第2层、第3层VNI、租户VRF、重叠Mac地址或组播组的数量进行扩展。
- 租户路由组播(TRM)、vPC交换矩阵对等、下行VNI(DSVNI)、新L3VNI、Q-in-VNI或Q-in-Q-in-VNI、vPC对等保留VLAN不匹配,或路径首选项的配置,其中指向其他站点的路径是通过备份SVI而不是DCI互联。
- 对于VxLAN EVPN配置,有关vPC枝叶交换机之间的备份SVI:
- 使用DCNM或NDFC进行的配置:假设选择了默认值“3600”作为VLAN,因此接口Vlan 3600被视为备用SVI。
- SVI上配置的IGP是OSPF或ISIS。在底层的vPC对等之间建立iBGP IPv4单播会话且未在SVI上配置IGP的配置报告为缺少备份SVI。
常见问题解答
问题1:我能否为同show tech-support details
一SR中的多台交换机上传报告,以获取所有交换机的运行状况检查报告?
回答1:这是自动案例处理,运行状况检查由虚拟TAC工程师执行。仅对第一次上传的执行运行状show tech-support details
况检查。
问题2:我可以为同一设备上传多个s
how tech-support details
(例如,每隔几个小时捕获一次),以便为这两个设备完成运行状况检查吗?
回答:这是由虚拟TAC工程师执行的自动无状态案例处理,而且无论上传的文件是来自同一台交换机还是不同交换机show tech-support details
,系统都会对首先上传到SR的文件执行运行状况和配置检查。
问题3:如果交换机的文件被压缩为单个rar/gz文件show tech-support details
,然后上传到SR,我能否对其进行运行状况检查?
回答3:否。如果多个文件作为单个rar/zip/gz文件上传show tech-support details
,则只会处理存档中的第一个文件以进行运行状况检查。
问题4:我没有看到覆盖Nexus 5000/6000平台的运行状况和配置检查。是否会在后期进行覆盖?
回答:否。目前尚未计划在不久的将来覆盖Nexus5000/6000平台。
问题5:如果对报告的某个运行状况检查失败有疑问,该怎么办?
回答:请打开单独的TAC服务请求,以获得有关特定运行状况检查结果的进一步帮助。强烈建议附加运行状况检查报告,并参阅为自动运行状况和配置检查打开的服务请求(SR)案例编号。
问题6:能否使用为Automated Health and Config Check打开的相同SR来排除所发现的问题?
回答6:否。由于主动运行状况检查是自动进行的,请打开新的服务请求以排除故障并解决报告的问题。请注意,在运行状况报告发布后的24小时内,已关闭打开进行运行状况检查的SR。
问题7:自动运行状况和配置检查是否针对运行比前面提到的版本更旧的交换机的文件运行show tech-support details
?
回答:自动运行状况和配置检查针对以下提到的平台和软件版本构建。对于运行较旧版本的设备,这是尽力而为的,并且不能保证报告的准确性。
- 运行统一NX-OS软件映像的Nexus 3x00系列交换机:7.0(3)Ix或更高版本
- 运行NX-OS软件7.x或更高版本的Nexus 7000/7700系列交换机
- 运行统一NX-OS软件映像的Nexus 9x00系列交换机:7.0(3)Ix或更高版本
问题8:如何关闭为Health Check打开的SR?
回答:在发送第一个Health Check报告后,SR将在24小时内关闭。无需用户对SR关闭采取任何操作。
问题9:如何共享有关主动运行状况和配置检查的评论或反馈?
A9:请通过电子邮件将其共享到Nexus-HealthCheck-Feedback@cisco.com
问题10:建议使用什么方法捕获交换机或show tech-support
从交show tech-support details
换机捕获数据?
回答:强烈建议将show tech-support
或show tech-support details
命令的输出定向到(如下例所示),而不是将其捕获到终端应用程序(例如,SecureCRT、PuTTY)中的日志文件bootflash:
。 请记住,终端应用程序捕获的日志文件可能是UTF-8-BOM格式(或类似格式),而自动运行状况检查不支持该格式。自动运行状况和配置检查仅支持ASCII或UTF-8格式的文件。
将输出重定向到并压缩文件bootflash:
的CLI示例:
Nexus1# show tech-support details >> bootflash:showtechdetails_Nexus1.txt
Nexus1# gzip bootflash:showtechdetails_Nexus1.txt
反馈
我们高度赞赏您对这些工具操作的任何反馈。如果您有任何意见或建议(例如,有关生成的报告的易用性、范围和质量的意见),请通过Nexus-HealthCheck-Feedback@cisco.com与我们分享。