La documentazione per questo prodotto è stata redatta cercando di utilizzare un linguaggio senza pregiudizi. Ai fini di questa documentazione, per linguaggio senza di pregiudizi si intende un linguaggio che non implica discriminazioni basate su età, disabilità, genere, identità razziale, identità etnica, orientamento sessuale, status socioeconomico e intersezionalità. Le eventuali eccezioni possono dipendere dal linguaggio codificato nelle interfacce utente del software del prodotto, dal linguaggio utilizzato nella documentazione RFP o dal linguaggio utilizzato in prodotti di terze parti a cui si fa riferimento. Scopri di più sul modo in cui Cisco utilizza il linguaggio inclusivo.
Cisco ha tradotto questo documento utilizzando una combinazione di tecnologie automatiche e umane per offrire ai nostri utenti in tutto il mondo contenuti di supporto nella propria lingua. Si noti che anche la migliore traduzione automatica non sarà mai accurata come quella fornita da un traduttore professionista. Cisco Systems, Inc. non si assume alcuna responsabilità per l’accuratezza di queste traduzioni e consiglia di consultare sempre il documento originale in inglese (disponibile al link fornito).
In questo documento viene descritto il comportamento di esaurimento della durata delle unità a stato solido (SSD) sulle piattaforme switch ACI (Application Centric Infrastructure).
Se l'atterraggio in questa pagina è stato causato da un errore SSD generato in Application Policy Infrastructure Controller (APIC) (non un nodo di switch), fare riferimento a FN64329.
APIC SSD Replacement documenta la procedura di sostituzione delle unità SSD APIC.
I nodi ACI Leaf e Spine sfruttano le unità SSD per lo storage e la registrazione degli eventi. Tutte le unità a stato solido, indipendentemente dal tipo di fornitore, hanno una durata fissa basata su attributi specifici definiti dal produttore. Alcuni esempi includono il numero di operazioni di scrittura ed eliminazione, nonché il volume dei dati trasferiti alle unità in un determinato periodo di tempo. La durata delle unità SSD sui nodi Leaf e Spine può esaurirsi a causa dell'usura regolare. Se l'utente non intraprende un'azione appropriata su uno switch con SSD prossima all'esaurimento, lo switch potrebbe bloccarsi a causa dell'attivazione della modalità di sola lettura dell'SSD. Per questo motivo, è imperativo dare priorità alla sostituzione delle unità a stato solido nel caso in cui l'errore F3073 venga generato su un determinato nodo. Le unità SSD possono essere sostituite sul campo da tecnici sul campo certificati Cisco.
F3073 è stato implementato nelle versioni 2.1(4), 2.2(4), 2.3(1o) e 3.1(2m). Tutte le versioni software successive hanno la funzionalità per aumentare la F3073.
Nota: se si esegue una versione del software ACI priva di funzionalità di monitoraggio SSD, si consiglia di eseguire l'aggiornamento a una versione in cui sia disponibile tale monitoraggio.
1. Quando lo switch non si avvia, sulla console si possono verificare i seguenti errori:
/dev/hd-cfg0: ********** WARNING: Filesystem still has errors **********
e2fsck 1.42.1 (17-Feb-2012)
/dev/hd-cfg1: recovering journal
/sbin/e2fsck: unable to set superblock flags on /dev/hd-cfg1
2. Il sistema è in grado di sollevare proattivamente i guasti relativi alle unità SSD (F3073 o F3074 in base all'utilizzo della durata delle unità SSD) nelle versioni di codice più recenti (vedere la sezione successiva).
F3074: fltEqptFlashFlash-minor-alarm (80% lifetime)
F3073: fltEqptFlashFlash-worn-out (90% lifetime)
3. L'errore F3525 potrebbe inoltre essere generato in caso di utilizzo intensivo di SSD. Questo errore è spesso confuso con l'F3073/F3074.
# fault.Inst
code : F3525
ack : no
annotation :
cause : equipment-flash-warning
changeSet : deltape (New: 21), peCycles (New: 1678), tbw (New: 32.465179), warning (New: yes)
childAction :
created : 2019-08-05T18:22:01.455-07:00
delegated : no
descr : High SSD usage observed. Please check switch activity and contact Cisco Technical Support about high SSD usage.
dn : topology/pod-1/node-206/sys/ch/supslot-1/sup/flash/fault-F3525
domain : infra
extMngdBy : undefined
highestSeverity : warning
lastTransition : 2019-08-05T18:24:02.029-07:00
lc : raised
modTs : never
occur : 1
origSeverity : warning
prevSeverity : warning
rn : fault-F3525
rule : eqpt-flash-flash-warning-alarm
severity : warning
status :
subject : flash-warning-alarm
type : operational
L'errore F3525 viene generato se i cicli P/E (cancellazione programmata) aumentano di oltre 21 in sette giorni. Ciò non significa che le unità SSD siano esaurite, ma semplicemente che vi sia una grande variabilità che potrebbe causare l'esaurimento delle unità.
È necessario utilizzare il Technical Assistance Center (TAC) per comprendere le cause di questo cambiamento e risolverle. È inoltre prevista la modifica delle soglie che causano l'aumento di F3525 per un tipo specifico di SSD (vedere Criteri di accesso > Criteri > Switch > Criteri di configurazione flash delle apparecchiature).
Per controllare lo stato della durata delle unità SSD, è possibile procedere in due modi:
Il monitoraggio della durata delle unità SSD è stato aggiunto come parte dell'ID bug Cisco CSCve88634 nelle seguenti versioni del codice:
Un errore di minore entità viene generato quando l'unità raggiunge l'80% della sua durata e un errore di maggiore entità viene generato quando supera il 90% della sua durata.
Ciò consente agli operatori di rete di monitorare e sostituire proattivamente qualsiasi switch prima che si guasti a causa del superamento della durata delle unità SSD.
Nelle versioni precedenti del codice non era presente un controllo della durata delle unità SSD per gli switch SSD. Pertanto, anche se lo switch si stava avvicinando alla scadenza dell'unità SSD, non vi sarebbe alcun guasto.
La registrazione dell'utilizzo delle unità SSD è stata introdotta a partire da queste versioni: 3.2(5d), 3.2(6i), 3.2(7f) e 4.1(1i).
a-leaf101# cat /mnt/pss/ssd_log_amp.log (Tested on 4.2.3l)
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Mon Dec 16 19:00:01 EST 2019 16531370 0 29398 12350 100 0 122396965772 3825894828 60841125365 16 0.00 % 0 0
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Tue Dec 17 19:00:01 EST 2019 16531725 0 29422 12355 100 0 122447755358 3827482016 60858831240 16 0.00 % 12355 61606629993
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Wed Dec 18 19:00:01 EST 2019 16532222 0 29446 12359 100 0 122495197374 3828964594 60875667807 16 0.00 % 12359 61636366134
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Thu Dec 19 19:00:01 EST 2019 16533056 0 29470 12364 100 0 122542269672 3830435617 60892533342 16 0.00 % 12364 61666601865
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Fri Dec 20 19:00:01 EST 2019 16534010 0 29494 12367 100 0 122587126224 3831837398 60908759296 16 0.00 % 12367 61694592882
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Sat Dec 21 19:00:01 EST 2019 16535311 0 29518 12372 100 0 122631804318 3833233605 60925205662 16 0.00 % 12372 61723045022
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Sun Dec 22 19:00:01 EST 2019 16536727 0 29542 12376 100 0 122676829388 3834640654 60941741722 16 0.00 % 12376 61751623726
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Mon Dec 23 19:00:01 EST 2019 16538321 0 29566 12380 100 0 122722137414 3836056544 60958504969 16 0.00 % 12380 61780395692
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Tue Dec 24 19:00:01 EST 2019 16539858 0 29591 12384 100 0 122767087802 3837461258 60975050343 16 0.00 % 12384 61808582833
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Wed Dec 25 19:00:01 EST 2019 16541121 0 29615 12388 100 0 122812238580 3838872234 60991578411 16 0.00 % 12388 61837188237
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Thu Dec 26 19:00:01 EST 2019 16542653 0 29639 12393 100 0 122857007868 3840271286 61008101155 16 0.00 % 12393 61865429457
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Fri Dec 27 19:00:01 EST 2019 16544352 0 29663 12397 100 0 122901807026 3841671272 61024757511 16 0.00 % 12397 61893705871
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Sat Dec 28 19:00:01 EST 2019 16546213 0 29687 12401 100 0 122946927200 3843081289 61041459287 16 0.00 % 12401 61922169689
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Sun Dec 29 19:00:01 EST 2019 16549522 0 29711 12405 100 0 122991584018 3844476827 61058889999 16 0.00 % 12405 61950124731
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Mon Dec 30 19:00:01 EST 2019 16551885 0 29735 12410 100 0 123036252528 3845872732 61075846564 16 0.00 % 12410 61977362529
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Tue Dec 31 19:00:01 EST 2019 16553858 0 29759 12414 100 0 123098133082 3847806568 61093085451 16 0.00 % 12414 62022286518
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Wed Jan 1 19:00:01 EST 2020 16555127 0 29783 12418 100 0 123142018610 3849178024 61109758713 16 0.00 % 12418 62048933159
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Thu Jan 2 19:00:01 EST 2020 16556532 0 29808 12422 100 0 123186637556 3850572390 61126687626 16 0.00 % 12422 62076878843
Model SerialNo SW-Version Date R.Error(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attr(210) TBW(246) WAF DWAF DPE DTBW
Micron_M600_MTFDDAT064MBF MSA195207V1 14.2(3l) 2020-01-03 16557977 0 29832 12428 100 0 123278298184 16 0.00 % 0 0
Micron_M600_MTFDDAT064MBF MSA195207V1 14.2(3l) 2020-01-04 16558440 0 29856 12433 100 0 123323818606 16 0.00 % 5 45520422
Micron_M600_MTFDDAT064MBF MSA195207V1 14.2(3l) 2020-01-05 16559031 0 29880 12438 100 0 123369348610 16 0.00 % 5 45530004
Micron_M600_MTFDDAT064MBF MSA195207V1 14.2(3l) 2020-01-06 16561567 0 29904 12443 100 0 123415316270 16 0.00 % 5 45967660
Micron_M600_MTFDDAT064MBF MSA195207V1 14.2(3l) 2020-01-07 16564701 0 29928 12448 100 0 123460483898 16 0.00 % 5 45167628
Micron_M600_MTFDDAT064MBF MSA195207V1 14.2(3l) 2020-01-08 16565955 0 29952 12453 100 0 123505550532 16 0.00 % 5 45066634
il file ssd_log_amp.log si trova nel supporto tecnico switch 1of3.
Per ogni ulteriore output di comandi relativi al produttore, sono necessari i privilegi di un utente root che richiederebbero una richiesta di servizio TAC.
Sono stati apportati numerosi miglioramenti per ottimizzare le operazioni di scrittura in modo da mantenere la disponibilità, riducendo al contempo la quantità di dati scritti su disco. Queste modifiche sono state introdotte in versioni diverse.
Le release 3.2.4d e successive e 4.x e successive dispongono di tutti i miglioramenti di monitoraggio e ottimizzazione degli errori necessari per prolungare la durata delle unità SSD. Questo naturalmente non significa che l'aggiornamento a queste versioni impedisca assolutamente il problema della durata delle unità SSD.
L'ID bug Cisco CSCvt36458 ha modificato il comportamento previsto di un nodo ACI Switch in seguito a un ricaricamento irregolare:
Tipo di caricamento | ID bug Cisco CSCvt36458 | Dopo l'ID bug Cisco CSCvt36458 (4.2(6d) e successivi e 5.1(1h) e successivi) |
Aggiornamenti | Senza stato | Senza stato |
Ricaricamenti senza problemi (ricaricamenti manuali, reimpostazione hap) | Stateful | Stateful |
Ricaricamenti non eseguiti (errore irreversibile del kernel, ciclo di alimentazione) | Stateful | Senza stato |
In breve, i ricaricamenti degli switch eseguiti correttamente continuano a utilizzare il database al momento dell'avvio. I ricaricamenti di switch non eseguiti ora richiedono che tutte le policy vengano estratte dall'APIC, analogamente a un aggiornamento.
È possibile sostituire l'SSD sul campo?
Sì. Cisco sta ora sostituendo le unità a stato solido sul campo con l'aiuto di un tecnico sul campo certificato. Sugli aculei modulari, viene sostituito l'intero supervisore.
È necessario sostituire in modo proattivo l'hardware dello switch?
I tecnici TAC possono controllare i valori smartctl e valutare quali switch hanno una durata maggiore, in modo che sia possibile sostituire immediatamente gli switch più urgenti e quindi procedere gradualmente alla sostituzione di quelli meno urgenti.
Esistono PID hardware specifici più soggetti a guasti SSD?
No. L'utilizzo della durata delle unità SSD può variare a seconda dei dispositivi nello stesso ambiente. L'utilizzo dei dischi SSD dipende dalla frequenza con cui il dispositivo deve scrivere i registri per la conservazione degli eventi. Un dispositivo che registra un numero elevato di eventi generati dall'instabilità della rete può raggiungere la durata delle unità SSD prima di altri. Cisco sostiene quindi la necessità di utilizzare le versioni più recenti per garantire che l'ottimizzazione del codice aiuti a controllare le scritture delle unità SSD e ne prolunghi la durata.
Revisione | Data di pubblicazione | Commenti |
---|---|---|
3.0 |
18-Jan-2024 |
La sezione Domande frequenti varie è stata aggiornata a causa delle recenti modifiche apportate al processo di sostituzione delle unità SSD. |
1.0 |
09-Jan-2020 |
Versione iniziale |