La documentazione per questo prodotto è stata redatta cercando di utilizzare un linguaggio senza pregiudizi. Ai fini di questa documentazione, per linguaggio senza di pregiudizi si intende un linguaggio che non implica discriminazioni basate su età, disabilità, genere, identità razziale, identità etnica, orientamento sessuale, status socioeconomico e intersezionalità. Le eventuali eccezioni possono dipendere dal linguaggio codificato nelle interfacce utente del software del prodotto, dal linguaggio utilizzato nella documentazione RFP o dal linguaggio utilizzato in prodotti di terze parti a cui si fa riferimento. Scopri di più sul modo in cui Cisco utilizza il linguaggio inclusivo.
Cisco ha tradotto questo documento utilizzando una combinazione di tecnologie automatiche e umane per offrire ai nostri utenti in tutto il mondo contenuti di supporto nella propria lingua. Si noti che anche la migliore traduzione automatica non sarà mai accurata come quella fornita da un traduttore professionista. Cisco Systems, Inc. non si assume alcuna responsabilità per l’accuratezza di queste traduzioni e consiglia di consultare sempre il documento originale in inglese (disponibile al link fornito).
In questo documento vengono descritti i principali difetti del software che possono causare l'inserimento di frame di dati danneggiati in un'infrastruttura UCS (Unified Computing System) identificata dai contatori di errore CRC (Cyclic Redundancy Check) o FCS (Frame Check Sequence).
Nota: Questo documento non descrive come isolare il punto di iniezione di CRC.
In un ambiente UCS, gli errori CRC possono avere un impatto elevato. L'isolamento e l'attenuazione della causa di tali errori devono essere trattati con la massima priorità.
L'impatto dipende dal punto in cui si verifica il problema, che può estendersi a più chassis e influire sulla connettività Ethernet e di storage.
Sebbene il guasto fisico dei componenti (in particolare dei cavi e degli SFP (Small Form-Factor Pluggable)) sia la causa più frequente, esistono difetti noti del software che possono causare anche errori CRC.
Questi difetti causano una bassa forza del segnale tra i vari componenti, che porta a corrotti fotogrammi.
Un concetto chiave a cui si può fare riferimento è l'altezza dell'occhio, che è una misura dell'integrità del segnale tra i componenti del livello fisico. Se il livello del segnale scende sotto un particolare livello (differisce tra i componenti), i frame inviati o ricevuti possono essere danneggiati.
Cisco consiglia di aver esaminato i problemi comuni di prestazioni dei FlexPod, in particolare la perdita di frame e pacchetti, per identificare la causa di errori CRC indesiderati sul fabric UCS e/o sugli switch upstream.
Anche se il documento è destinato alle installazioni di FlexPod, la sezione citata è applicabile agli ambienti non FlexPod UCS.
Se nell'ambiente UCS si utilizza un cablaggio Twinax, è più probabile che uno o più di questi difetti influiscano sul cablaggio, in quanto la maggior parte dei difetti riguarda il cablaggio basato su Twinax.
Gli ambienti che dispongono solo di cavi ottici possono comunque presentare problemi, in quanto gli errori CRC possono essere iniettati tra l'adattatore e l'IOM (UCS I/O Module). Tuttavia, questa impostazione è limitata a server specifici e non influisce su più server o chassis in caso di problemi relativi alle porte Uplink o Server.
Se la disabilitazione/abilitazione di una porta in UCS Manager sembra arrestare gli errori dell'interfaccia senza eseguire ulteriori operazioni, ad esempio lo swap dei cavi o il riposizionamento, è necessario eseguire ulteriori controlli per verificare se la causa del problema è un problema software.
Se sono stati rilevati errori CRC in seguito a flap/riavvii improvvisi delle porte, queste anomalie possono essere una possibile causa.
Un'indicazione chiave di un difetto software relativo al CRC è un valore di altezza dell'occhio basso per una o più porte.
I comandi più comuni utilizzati per verificare questa condizione sono:
Switch basati su Nexus 5500:
show hardware internal carmel eye
UCS 6200 Fabric Interconnect:
connect nxos a show hardware internal carmel eye exit connect nxos b show hardware internal carmel eye exit
Uscita di esempio che mostra una buona altezza dell'occhio (200 mv):
UCSB-5-A(nxos)# show hardware internal carmel eye
+-------+------------+-------------+------------+----------------------------+--+--+--+--+--+--+--+--+--+--+
| Port | Eye Height | Eye Width | Raw values | Time measured |St|20|21|22|23|24|25|26|2E|2F|
+-------+------------+-------------+------------+----------------------------+--+--+--+--+--+--+--+--+--+--+
Eth 1/1 | 200 mv | 796 mUI | 40/ 33 | 08/31/2016 16:48:52.345248 |a9|ee|82|00|00|6e|82|00|88|00|
fi0 | 200 mv | 843 mUI | 40/ 36 | 08/31/2016 16:48:52.350360 |00|00|00|00|00|00|00|00|00|00|
fi1 | 200 mv | 859 mUI | 40/ 37 | 08/31/2016 16:48:52.355470 |00|00|00|00|00|00|00|00|00|00|
Su queste piattaforme, se il valore è:
i comandi precedenti non sono applicabili alle interconnessioni fabric 6332, 6454 o 6324
UCS 2200 IOM Module:
connect local-mgmt a or connect local-mgmt b connect iom x show platform software woodside sts (Note: The HI number/s for the servers that you need to check) dbgexec woo kr_geteye HIxx Ctrl-C to exit dbgexec mode
Uscita di esempio che mostra una buona altezza dell'occhio (125 mV):
woo> kr_geteye HI31
[serdes] reg: 64/40h = 42ch
check_kr_status: HI31: up (kr_retries=0)
sent SPICO interrupt(20, 0, 49)
Vertical eye result 0x14
sent SPICO interrupt(20, 0, 49)
Horizontal eye result 0x28
HI31: 125.0 mV, 0.6250 UI (NORM)
UCS 2300 IOM Module:
connect local-mgmt a or connect local-mgmt b connect iom x show platform software tiburon sts (Note the HI number/s for the servers you need to check) dbgexec tib kr_geteye 0 HIxx Ctrl-C to exit dbgexec mode
Output di esempio che mostra una buona altezza dell'occhio (156 mv):
tib> kr_geteye 0 HI31
Start eye measurement HI31...
bottom: -73.5 (mV), top: 82.7 (mV), height: 156.2 (mV)
left: -0.34 (UI), right: 0.33 (UI), width: 0.69 (UI)
total time = 0.119456 sec
Su queste piattaforme, se il valore dell'altezza è:
Questo difetto si verifica sulle porte di interconnessione fabric, ad esempio le porte Uplink e Server.
Il problema è risolto in UCS Infrastructure 2.2(3a). Per altre versioni corrette, fare riferimento a Bug Search Tool.
CSCuw36398 Rilevamento degli errori CRC sui cavi in rame
Questo difetto si verifica sulle porte Fabric Interconnect, ad esempio le porte Uplink e Server
È fissato in UCS Infrastructure 2.2(7b). Per altre versioni fisse, consultare Bug Search Tool.
Questo difetto viene osservato tra le interfacce host IOM (HIF) e le interfacce backplane degli adattatori.
Nel frattempo è stato rilevato che ciò può essere causato da problemi di backplane dello chassis. Se si verifica questo problema, aprire una richiesta di assistenza con Cisco TAC.
Questo difetto viene rilevato tra IOM HIF e Adapters, che influisce sui singoli server.
Attualmente sotto indagine.
Fisso nel firmware 2.0(9c) della serie C. Per altre versioni fisse, consultare Bug Search Tool.
La condizione di attivazione di questo bug è l'inverso del comune pensiero che Active Twinax è meno probabile che causi problemi CRC a causa della sua trasmissione di potenza attiva.
Sebbene non sia strettamente un bug UCS, è ancora comunemente visto nelle configurazioni UCS a causa della prevalenza di Nexus 55xx a monte. Per ulteriori informazioni sulle versioni fisse, consultare Bug Search Tool.
Per ulteriori informazioni, consultare la nota sulla versione di ciascun bug. Tuttavia, se si riscontrano bassi valori di altezza oculare, si consiglia di chiudere la porta o di non chiuderla.
In caso di un difetto di IOM/altezza visiva della scheda, è possibile ripristinare il DCE nell'interfaccia. Selezionare Server > Adapter > Interfaccia DCE > Reset Connectivity (Reimposta connettività) a seconda delle esigenze.
È quindi necessario controllare le uscite per verificare se l'altezza dell'occhio è aumentata a valori buoni e se i contatori CRC non sono più incrementati.
Per aumentare l'altezza dell'occhio in modo sufficiente possono essere necessari diversi lembi (generalmente fino a 5).
Se l'altezza dell'occhio non viene ripristinata dopo diversi lembi di collegamento, potrebbe verificarsi un guasto hardware del componente.
Quando si flap delle porte, tenere presente che questa operazione può causare un rilevamento superficiale da parte di UCS Manager.
In circostanze normali, un rilevamento superficiale non ha alcun impatto sul piano dati; tuttavia, esistono difetti noti che influiscono sui blade B200-M4 (vedere CSCut61527 per il difetto più comune). Un'individuazione superficiale può trasformarsi in un'individuazione approfondita, che può attivare il riavvio del sistema operativo host.
Cisco consiglia di consultare le note sulla versione di UCS Manager per altri difetti applicabili.
Oltre al flapping manuale delle porte come fase di ripristino reattivo, la gestione degli errori delle porte basata su criteri UCS in UCS Manager 2.2(4) e versioni successive può essere utilizzata per disabilitare le porte NIF quando vengono rilevati errori CRC. Sebbene questa azione possa limitare rapidamente l'impatto degli errori CRC, può causare l'interruzione del flusso del traffico, pertanto non è abilitata per impostazione predefinita ed è necessario prestare attenzione se viene abilitata.
UCS Manager genera errori per gli errori CRC e tali errori possono essere monitorati tramite l'API XML o il protocollo SNMP (Simple Network Management Protocol).