Einführung
Dieser Artikel ist eine Erweiterung des Dokuments "Nexus 7000 Supervisor 2/2E Compact Flash Failure Recovery", das alle möglichen Fehlerszenarien behandelt. Wenn das Flash-Wiederherstellungstool nicht ausgeführt werden kann, kann dieses Dokument nützlich sein. Es wird empfohlen, über eine Konsole auf das Gerät zuzugreifen, um die Änderungen durchzuführen. Es wird außerdem dringend empfohlen, keine Änderungen unter dem Linux-Kernel vorzunehmen, der im Dokument nicht erwähnt wird, da dies Auswirkungen auf den Switch-Betrieb haben kann. Cisco TAC-Überwachung ist ratsam.
Hintergrund
Wie im anderen Dokument erläutert, ist jeder N7K-Supervisor 2/2E mit zwei eUSB-Flash-Geräten in der RAID1-Konfiguration, einem primären und einem Mirror ausgestattet. Gemeinsam stellen sie nichtflüchtige Repositorys für Boot-Images, Startkonfiguration und persistente Anwendungsdaten bereit. In einer Situation, in der das RAID für einen Supervisor im Chassis ausfällt, führen wir das Flash-Wiederherstellungstool aus, um dies zu beheben. In fast allen Fällen wird das Flash-Wiederherstellungstool nicht ausgeführt, wenn es über den Supervisor neu geladen wird bzw. ausfällt. In bestimmten Szenarien besteht die Möglichkeit, dies ohne Neuladen/Failover zu beheben.
Voraussetzungen
Anforderungen
Cisco empfiehlt, dass Sie über Kenntnisse der Wiederherstellungs-Methoden für Cisco Nexus OS, Storage oder Flash-Laufwerke und des Debuggens auf Linux-Ebene verfügen.
Verwendete Komponenten
Switches der Serie Nexus 7000
Symptom
In einem Supervisor wird ein RAID-Fehler festgestellt. Beim Versuch, den Flash-Speicher für die betroffenen Supervisoren wiederherzustellen, wird beim Ausführen des Flash-Wiederherstellungstools folgender Fehler angezeigt:
Switches werden mit Fehlercode 0xe1 als RAID-Fehlerstatus ausgeführt.
ERROR: Cannot perform recovery. /dev/sdb has incorrect partition info.
ERROR: Disk /dev/sdb needs to be manually inspected for errors.
INFO: No recovery was attempted on module 5. All flashes left intact.
INFO: A detailed copy of the this log was saved as volatile:flash_repair_log_mod5.tgz.
Lösung
Laden Sie das Debug-Plugin auf dem Switch, um sich bei der Linux-Shell anzumelden.
Switch# load bootflash:n7000-s2-debug-sh.6.1.4a.gbin
Bitte seien Sie vorsichtig, während Sie die Befehle hier ausführen.
Sobald wir die Linux-Eingabeaufforderung erhalten, suchen Sie nach der betroffenen Partition gemäß der Fehlermeldung. In unserem Fall ist es /dev/sdb. Es könnte auch andere Partitionen sein.
Linux(debug)# ls -l /dev/sd?
brw-r----- 1 root root 8, 0 Aug 28 2015 sda
brw-rw-r-- 1 root disk 8, 32 Dec 18 2013 sdc
brw-rw-r-- 1 root disk 8, 48 Dec 18 2013 sdd
brw-rw-r-- 1 root disk 8, 64 Dec 18 2013 sde
brw-rw-r-- 1 root disk 8, 80 Dec 18 2013 sdf
brw-rw-r-- 1 root disk 8, 96 Dec 18 2013 sdg
brw-rw-r-- 1 root disk 8, 112 Dec 18 2013 sdh
brw-rw-r-- 1 root disk 8, 128 Dec 18 2013 sdi
brw-rw-r-- 1 root disk 8, 144 Dec 18 2013 sdj
brw-rw-r-- 1 root disk 8, 160 Dec 18 2013 sdk
brw-rw-r-- 1 root disk 8, 176 Dec 18 2013 sdl
brw-rw-r-- 1 root disk 8, 192 Dec 18 2013 sdm
Die Partition wurde als fehlend identifiziert, was zu einem Fehler führt, während das Wiederherstellungstool ausgeführt wird. Erstellen Sie die fehlende Partition manuell mit der gleichen Berechtigung wie andere Blöcke.
Linux(debug)# mknod -m 664 /dev/sdb b 8 16
Nun können wir die sdb-Partition unter /dev,
Linux(debug)# ls -l /dev/sd?
brw-r----- 1 root root 8, 0 Aug 28 2015 sda
brw-rw-r-- 1 root root 8, 16 May 26 07:31 sdb
brw-rw-r-- 1 root disk 8, 32 Dec 18 2013 sdc
brw-rw-r-- 1 root disk 8, 48 Dec 18 2013 sdd
brw-rw-r-- 1 root disk 8, 64 Dec 18 2013 sde
brw-rw-r-- 1 root disk 8, 80 Dec 18 2013 sdf
brw-rw-r-- 1 root disk 8, 96 Dec 18 2013 sdg
brw-rw-r-- 1 root disk 8, 112 Dec 18 2013 sdh
brw-rw-r-- 1 root disk 8, 128 Dec 18 2013 sdi
brw-rw-r-- 1 root disk 8, 144 Dec 18 2013 sdj
brw-rw-r-- 1 root disk 8, 160 Dec 18 2013 sdk
brw-rw-r-- 1 root disk 8, 176 Dec 18 2013 sdl
brw-rw-r-- 1 root disk 8, 192 Dec 18 2013 sdm
Beenden Sie die Linux-Shell, und führen Sie das Flash-Wiederherstellungstool erneut aus.
Dieses Mal ohne Fehlermeldungen und der Raid-Fehler auf dem primären Flash wurde wiederhergestellt (0xf0). Gleiches mit dem Befehl bestätigt,
"slot x show system internal raid | i i cmos|block | head line 5"
Er sollte fehlerfrei ausgeführt werden und in der Lage sein, den betroffenen Supervisor aus dem Status "RAID Failure" (RAID-Fehler) wiederherzustellen. Falls das Wiederherstellungstool weiterhin nicht ausgeführt wird, könnte dies auf einen anderen Grund oder auf eine tatsächliche Beschädigung der Partition zurückzuführen sein, und möglicherweise müssen wir auf ein Neuladen/Failover zurückgreifen.
Zugehörige Informationen