Inleiding
In dit document worden de stappen beschreven voor probleemoplossing van een probleem waarbij een blade niet wordt gedetecteerd vanwege serverfout vermogensstatus-MC.
Voorwaarden
Vereisten
Cisco raadt u aan een werkkennis van deze onderwerpen te hebben:
- Cisco Unified Computing System (UCS)
- Cisco Fabric Interconnect (FI)
Gebruikte componenten
De informatie in dit document is gebaseerd op de volgende software- en hardware-versies:
- UCS B420-24M3-software
- UCS B440-24M3-software
De informatie in dit document is gebaseerd op de apparaten in een specifieke laboratoriumomgeving. Alle apparaten die in dit document worden beschreven, hadden een opgeschoonde (standaard)configuratie. Als uw netwerk live is, moet u zorgen dat u de potentiële impact van elke opdracht begrijpt.
Achtergrondinformatie
- Blade firmware upgrade, de server ging naar beneden nadat uptime beleid reboot.
- Wat power event in het datacenter.
Dit zou de mogelijke oorzaak van het probleem kunnen zijn.
Probleem
Deze foutmelding treedt op tijdens de herstart of tijdens de ontdekking.
"Kan de energiestatus van de blade niet wijzigen"
UCSM meldt deze waarschuwing voor een blade die niet is ingeschakeld
Blade die opnieuw is opgestart als onderdeel van firmware-upgrade of ander onderhoud kan met onderstaande boodschap in FSM niet ontdekken/opduiken:
"Kan de energiestatus van de server niet wijzigen-MC Fout(-20): Beheercontroller kan of is niet geslaagd in de verwerkingsaanvraag (hetzelfde:dme:computingPhysicalTurnup:Execute)"
SEL Logs tonen de volgende foutmeldingen:
CIMC | #0xde voor platform alert POWER_ON_FAIL | Predictief falen verbroken | somber
CIMC | #0xde voor platform alert POWER_ON_FAIL | Predictief falen bevestigd | Beweerd
Problemen oplossen
Maak vanuit de UCSM CLI-shell verbinding met de CIMC van de blade en controleer de voedingsstatus van de blade met de opdracht power
- SSH FI-IP-ADR.
- CIMC X aansluiten
- ondersteun
Failure Scenario # 1
OP:[ status ]
Power-State: [ on ]
VDD-Power-Good: [ inactive ]
Power-On-Fail: [ active ]
Power-Ctrl-Lock: [ unlocked ]
Power-System-Status: [ Good ]
Front-Panel Power Button: [ Enabled ]
Front-Panel Reset Button: [ Enabled ]
OP-CCODE:[ Success ]
Failure Scenario #2
OP:[ status ]
Power-State: [ off ]
VDD-Power-Good: [ inactive ]
Power-On-Fail: [ inactive ]
Power-Ctrl-Lock: [ permanent lock ] <<<----------------
Power-System-Status: [ Bad ] <<<---------------
Front-Panel Power Button: [ Disabled ]
Front-Panel Reset Button: [ Disabled ]
OP-CCODE:[ Success ]
Output van werkscenario #
[ help ]# power
OP:[ status ]
Power-State: [ on ]
VDD-Power-Good: [ active ]
Power-On-Fail: [ inactive ]
Power-Ctrl-Lock: [ unlocked ]
Power-System-Status: [ Good ]
Front-Panel Power Button: [ Enabled ]
Front-Panel Reset Button: [ Enabled ]
OP-CCODE:[ Success ]
[ power ]#
Controleer de sensorwaarde #
POWER_ON_FAIL | schijf -> | apart | 0x0200 | nvt | nvt | nvt | nvt | nvt | nvt | >> Niet werkend
Sensor waarde#
POWER_ON_FAIL | schijf -> | apart | 0x0100 | nvt | nvt | nvt | nvt | nvt | nvt | >>> Werken
Voer sensoren uit en controleer de waarden van de macht en voltagesensoren. Vergelijk de uitvoer met hetzelfde model van de blade dat op status is ingeschakeld.
Als de kolommen Lezen of Status voor bepaalde sensoren NAT zijn, is het mogelijk dat de hardware niet altijd defect is.
Logbestanden als fragment#
Sel.log#
CIMC | #0xde voor platform alert POWER_ON_FAIL | Predictief falen bevestigd | Beweerd
power-on-fail.hist binnen de tmp/techsupport_pidXXXX/CIMCX_TechSupport-nvram.tar.gz)
Als het bovenstaande niet helpt en als volgende stap, verzamel UCSM en Chassis techsupport logbundel.
Het helpt om de kwestie verder te onderzoeken.
Probeer met de eerder genoemde symptomen deze stappen om het probleem te herstellen.
Stap 1: Controleer of de FSM-status van de bladeserver "Mislukt" is met de beschrijving "state-MC Error(-20)".
Navigeren naar apparatuur > Chassis X > Server Y > FSM
Stap 2: Noteer het serienummer van de getroffen blade en neem de blade uit bedrijf.
<< IMP: Noteer het serienummer van de probleemblade op het tabblad Algemeen voordat u het apparaat uit bedrijf neemt. Dit is vereist in de latere fase van Stap 4 >>
Ga naar Apparatuur > Chassis X > Server Y > Algemeen > Serveronderhoud > Uit bedrijf nemen > OK.
Stap 3. FI-A/B# reset sleuf x/y
Bijvoorbeeld #Chassis2-Server 1 wordt geraakt.
FI-A# reset sleuf 2/1
Wacht 30-40 seconden nadat u bovenstaande opdracht hebt uitgevoerd
Stap 4: Opnieuw in bedrijf nemen van de blade die uit bedrijf is genomen.
Navigeren naar Apparatuur > Uit bedrijf genomen > Servers > Zoek naar de server die we uit bedrijf hebben genomen (Vind de juiste blade met serienummer Noteerd in Stap 2 voordat deze uit bedrijf wordt genomen) > Vink het vakje Opdracht opnieuw aan tegen de juiste blade (Valideren met serienummer) > Wijzigingen opslaan.
Stap 5: Los sleuven op, indien waargenomen.
Ga naar Apparatuur > Chassis X > Server Y.
Als u "Slot Issue" pop-up krijgt voor de blade die u opnieuw in bedrijf hebt genomen, dan controleert u het serienummer en klikt u op "hier" om de server in sleuf te accepteren.
De bladedetectie moet nu beginnen.
Wacht tot de detectie van de server is voltooid. Controleer de voortgang op het tabblad Server FSM.
Stap 6. Als stap één tot vijf niet helpt en FSM opnieuw mislukt, moet u het mes uit bedrijf nemen en proberen om het fysiek te ONDERZOEKEN.
Als nog steeds server niet kan ontdekken bereik naar Cisco TAC als dit een hardwarekwestie is.
NOTE: If you have B200 M4 blade and notice failure scenario #2 , please refer following bug and Contact TAC
CSCuv90289
B200 M4 fails to power on due to POWER_SYS_FLT
Gerelateerde informatie
Procedure om het chassis te ontdekken
UCSM-serverbeheershandleiding