Inleiding
In dit document wordt beschreven hoe u problemen kunt oplossen bij de veelvoorkomende Intersight Health Check-fouten voor HyperFlex-clusters.
Voorwaarden
Vereisten
Cisco raadt kennis van de volgende onderwerpen aan:
- Basiskennis van Network Time Protocol (NTP) en Domain Name System (DNS).
- Basis begrip van Linux opdrachtregel.
- Basiskennis van VMware ESXi.
- Basiskennis van VI-teksteditor.
- Hyperflex Cluster Operations.
Gebruikte componenten
De informatie in dit document is gebaseerd op:
HyperFlex Data Platform (HXDP) 5.0(2a) en hoger
De informatie in dit document is gebaseerd op de apparaten in een specifieke laboratoriumomgeving. Alle apparaten die in dit document worden beschreven, hadden een opgeschoonde (standaard)configuratie. Als uw netwerk live is, moet u zorgen dat u de potentiële impact van elke opdracht begrijpt.
Achtergrondinformatie
Cisco Intersight biedt de mogelijkheid om een reeks tests uit te voeren op een HyperFlex-cluster om ervoor te zorgen dat de clusterstatus in optimale conditie verkeert voor dagelijkse bewerkingen en onderhoudstaken.
Met HX 5.0(2a) begint Hyperflex met een diagramgebruikersaccount met verhoogde rechten voor probleemoplossing in de Hyperflex-opdrachtregel. Maak verbinding met Hyperflex Cluster Management IP (CMIP) door SSH te gebruiken als een beheergebruiker en vervolgens switch naar een diagramgebruiker.
HyperFlex StorageController 5.0(2d)
admin@192.168.202.30's password:
This is a Restricted shell.
Type '?' or 'help' to get the list of allowed commands.
hxshell:~$ su diag
Password:
____ __ _____ _ _ _ _____
| ___| / /_ _ | ____(_) __ _| |__ | |_ |_ _|_ _____
|___ \ _____ | '_ \ _| |_ | _| | |/ _` | '_ \| __| _____ | | \ \ /\ / / _ \
___) | |_____| | (_) | |_ _| | |___| | (_| | | | | |_ |_____| | | \ V V / (_) |
|____/ \___/ |_| |_____|_|\__, |_| |_|\__| |_| \_/\_/ \___/
|___/
Enter the output of above expression: 5
Valid captcha
diag#
Problemen oplossen
Fix ESXi VIB-controle "Sommige van de geïnstalleerde VIBs maken gebruik van gedevalueerde vmkAPI's"
Bij upgrading naar ESXi 7.0 en hoger zorgt Intersight ervoor dat de ESXi-hosts in een HyperFlex-cluster geen stuurprogramma's hebben die zijn gebouwd met afhankelijkheden van oudere vmkapi-versies. VMware biedt een lijst van de getroffen vSphere Installatiebundels (VIB’s) en beschrijft dit probleem in dit artikel: KB 78389
Log in op Hyperflex Connect web user interface (UI) en navigeer naar systeeminformatie. Klik op Knooppunten en selecteer de Hyperflex (HX)-knooppunt. Klik vervolgens op Enter HX Maintenance Mode.
Gebruik een SSH-client om verbinding te maken met het IP-adres voor beheer van de ESXi-host. Bevestig vervolgens de VIB's op de ESXi-host met deze opdracht:
esxcli software vib list
Verwijder VIB met deze opdracht:
esxcli software vib remove -n driver_VIB_name
Start de ESXi-host opnieuw op. Wanneer het online terugkomt, van HX Connect, selecteer de HX-knooppunt en klik op HX-onderhoudsmodus afsluiten.
Wacht tot het HX-cluster gezond is. Voer vervolgens dezelfde stappen uit voor de andere knooppunten in het cluster.
Fix vMotion Enabled "VMotion is uitgeschakeld op de ESXi-host"
Deze controle zorgt ervoor dat vMotion op alle ESXi-hosts in het HX-cluster is ingeschakeld. Vanaf vCenter moet elke ESXi-host beschikken over een Virtual switch (vSwitch) en een vmkernel-interface voor vMotion.
Verbind met Hyperflex Cluster Management IP (CMIP) met SSH als een administratieve gebruiker en voer deze opdracht uit:
hx_post_install
Selecteer optie 1 om vMotion te configureren:
admin@SpringpathController:~$ hx_post_install
Select hx_post_install workflow-
1. New/Existing Cluster
2. Expanded Cluster (for non-edge clusters)
3. Generate Certificate
Note: Workflow No.3 is mandatory to have unique SSL certificate in the cluster. By Generating this certificate, it will replace your current certificate. If you're performing cluster expansion, then this option is not required.
Selection: 1
Logging in to controller HX-01-cmip.example.com
HX CVM admin password:
Getting ESX hosts from HX cluster...
vCenter URL: 192.168.202.35
Enter vCenter username (user@domain): administrator@vsphere.local
vCenter Password:
Found datacenter HX-Clusters
Found cluster HX-01
post_install to be run for the following hosts:
HX-01-esxi-01.example.com
HX-01-esxi-02.example.com
HX-01-esxi-03.example.com
Enter ESX root password:
Enter vSphere license key? (y/n) n
Enable HA/DRS on cluster? (y/n) y
Successfully completed configuring cluster HA.
Disable SSH warning? (y/n) y
Add vmotion interfaces? (y/n) y
Netmask for vMotion: 255.255.254.0
VLAN ID: (0-4096) 208
vMotion MTU is set to use jumbo frames (9000 bytes). Do you want to change to 1500 bytes? (y/n) y
vMotion IP for HX-01-esxi-01.example.com: 192.168.208.17
Adding vmotion-208 to HX-01-esxi-01.example.com
Adding vmkernel to HX-01-esxi-01.example.com
vMotion IP for HX-01-esxi-02.example.com: 192.168.208.18
Adding vmotion-208 to HX-01-esxi-02.example.com
Adding vmkernel to HX-01-esxi-02.example.com
vMotion IP for HX-01-esxi-03.example.com: 192.168.208.19
Adding vmotion-208 to HX-01-esxi-03.example.com
Adding vmkernel to HX-01-esxi-03.example.com
Opmerking: voor Edge-clusters die met HX Installer worden geïmplementeerd, moet het script hx_post_install worden uitgevoerd vanaf de HX Installer CLI.
Fix vCenter Connectiviteitscontrole "vCenter Connectiviteitscontrole mislukt"
Maak verbinding met Hyperflex Cluster Management IP (CMIP) door SSH te gebruiken als een beheergebruiker en switch naar een diagramgebruiker. Zorg ervoor dat het HX-cluster bij vCenter is geregistreerd met deze opdracht:
diag# hxcli vcenter info
Cluster Name : San_Jose
vCenter Datacenter Name : MX-HX
vCenter Datacenter ID : datacenter-3
vCenter Cluster Name : San_Jose
vCenter Cluster ID : domain-c8140
vCenter URL : 10.31.123.186
vCenter URL moet het IP-adres of de volledig gekwalificeerde domeinnaam (FQDN) van de vCenter-server weergeven. Als de juiste informatie niet wordt weergegeven, registreert u het HX-cluster opnieuw met vCenter met deze opdracht:
diag# stcli cluster reregister --vcenter-datacenter MX-HX --vcenter-cluster San_Jose --vcenter-url 10.31.123.186 --vcenter-user administrator@vsphere.local
Reregister StorFS cluster with a new vCenter ...
Enter NEW vCenter Administrator password:
Cluster reregistration with new vCenter succeeded
Zorg ervoor dat er connectiviteit is tussen HX CMIP en vCenter met deze opdrachten:
diag# nc -uvz 10.31.123.186 80
Connection to 10.31.123.186 80 port [udp/http] succeeded!
diag# nc -uvz 10.31.123.186 443
Connection to 10.31.123.186 443 port [udp/https] succeeded!
Status reinigingsmiddel repareren "Cleaner Check fail"
Verbind met Hyperflex CMIP door SSH te gebruiken als een beheergebruiker en vervolgens switch te kiezen voor een diagramgebruiker. Voer deze opdracht uit om het knooppunt te identificeren waarop de schonere service niet actief is:
diag# stcli cleaner info
{ 'type': 'node', 'id': '7e83a6b2-a227-844b-87fb-f6e78e6a59be', 'name': '172.16.1.6' }: ONLINE
{ 'type': 'node', 'id': '8c83099e-b1e0-6549-a279-33da70d09343', 'name': '172.16.1.8' }: ONLINE
{ 'type': 'node', 'id': 'a697a21f-9311-3745-95b4-5d418bdc4ae0', 'name': '172.16.1.7' }: OFFLINE
In dit geval is 172.16.1.7 het IP-adres van de Storage Controller Virtual Machine (SCVM) waarop de reiniger niet actief is. Maak met behulp van SSH verbinding met het IP-adres voor beheer van elke SCVM in het cluster en zoek vervolgens met deze opdracht naar het IP-adres van eth1:
diag# ifconfig eth1
eth1 Link encap:Ethernet HWaddr 00:0c:29:38:2c:a7
inet addr:172.16.1.7 Bcast:172.16.255.255 Mask:255.255.0.0
UP BROADCAST RUNNING MULTICAST MTU:9000 Metric:1
RX packets:1036633674 errors:0 dropped:1881 overruns:0 frame:0
TX packets:983950879 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:723797691421 (723.7 GB) TX bytes:698522491473 (698.5 GB)
Start de reinigingsservice op het betreffende knooppunt met deze opdracht:
diag# sysmtool --ns cleaner --cmd start
Fix NTP-servicestatus "NTPD-servicestatus is OMLAAG"
Maak verbinding met HX CMIP door SSH te gebruiken als een beheergebruiker en vervolgens switch naar diagramgebruiker. Voer deze opdracht uit om te bevestigen dat de NTP-service is gestopt.
diag# service ntp status
* NTP server is not running
Als NTP-service niet actief is, voer dan deze opdracht uit om de NTP-service te starten.
diag# priv service ntp start
* Starting NTP server
...done.
Fix NTP-serverbereikbaarheid "NTP-servers - controle van bereikbaarheid mislukt"
Maak verbinding met HX CMIP door SSH te gebruiken als een beheergebruiker en vervolgens switch naar diagramgebruiker. Zorg ervoor dat de HX-cluster een bereikbare NTP-server(s) heeft geconfigureerd. Voer deze opdracht uit om de NTP-configuratie in het cluster te tonen.
diag# stcli services ntp show
10.31.123.226
Zorg ervoor dat er netwerkconnectiviteit is tussen elke SCVM in het HX-cluster en de NTP-server op poort 123.
diag# nc -uvz 10.31.123.226 123
Connection to 10.31.123.226 123 port [udp/ntp] succeeded!
Indien de NTP-server die in het cluster is geconfigureerd niet meer in gebruik is, kunt u een andere NTP-server in het cluster configureren.
stcli services ntp set NTP-IP-Address
Waarschuwing: stcli services ntp set overschrijft de huidige NTP configuratie in het cluster.
Fix DNS-serverbereikbaarheid "DNS-bereikbaarheidscontrole mislukt"
Maak verbinding met HX CMIP door SSH te gebruiken als een beheergebruiker en vervolgens switch naar diagramgebruiker. Zorg ervoor dat de HX-cluster een bereikbare DNS-server(s) heeft geconfigureerd. Voer deze opdracht uit om de DNS-configuratie in het cluster te tonen.
diag# stcli services dns show
10.31.123.226
Zorg ervoor dat er netwerkconnectiviteit is tussen elke SCVM in het HX-cluster en de DNS-server op poort 53.
diag# nc -uvz 10.31.123.226 53
Connection to 10.31.123.226 53 port [udp/domain] succeeded!
Indien de DNS-server die in het cluster is geconfigureerd niet meer in gebruik is, kunt u een andere DNS-server in het cluster configureren.
stcli services dns set DNS-IP-Adrress
Waarschuwing: stcli services dns set overschrijft de huidige DNS-configuratie in het cluster.
Fix Controller VM versie "Controller VM versie Waarde ontbreekt in het instellingenbestand op de ESXi Host"
Deze controle verzekert elke SCVM omvat guestinfo.stctlvm.version = "3.0.6-3" in het configuratiebestand.
Meld u aan bij HX Connect en zorg ervoor dat het cluster gezond is.
Verbind met elke ESXi-host in het cluster met behulp van SSH met de root-account. Voer deze opdracht vervolgens uit
[root@San-Jose-Server-1:~] grep guestinfo /vmfs/volumes/SpringpathDS-FCH2119V1NH/stCtlVM-FCH2119V1NH/stCtlVM-FCH2119V1NH.vmx
guestinfo.stctlvm.version = "3.0.6-3"
guestinfo.stctlvm.configrdm = "False"
guestinfo.stctlvm.hardware.model = "HXAF240C-M4SX"
guestinfo.stctlvm.role = "storage"
Waarschuwing: de datastorennaam en de SCVM-naam kunnen op uw cluster verschillend zijn. U kunt Spring typen en vervolgens op de Tab-toets drukken om de datastore naam automatisch te voltooien. Voor de naam van de SCVM kunt u stCtl typen en vervolgens op de Tab-toets drukken om de SCVM-naam automatisch te voltooien.
Als het configuratiebestand van de SCVM niet guestinfo.stctlvm.version = "3.0.6-3" bevat, log dan in vCenter en selecteer de SCVM. Klik op Acties, navigeer naar Aan/uit en selecteer Gastensysteem afsluiten om de SCVM op elegante wijze uit te schakelen.
Maak vanuit ESXi Command Line Interface (CLI) een back-up van het SCVM-configuratiebestand met deze opdracht:
cp /vmfs/volumes/SpringpathDS-FCH2119V1NH/stCtlVM-FCH2119V1NH/stCtlVM-FCH2119V1NH.vmx /vmfs/volumes/SpringpathDS-FCH2119V1NH/stCtlVM-FCH2119V1NH/stCtlVM-FCH2119V1NH.vmx.bak
Voer deze opdracht vervolgens uit om het configuratiebestand van de SCVM te openen:
[root@San-Jose-Server-1:~] vi /vmfs/volumes/SpringpathDS-FCH2119V1NH/stCtlVM-FCH2119V1NH/stCtlVM-FCH2119V1NH.vmx
Druk op de toets I om het bestand te bewerken, navigeer vervolgens naar het einde van het bestand en voeg deze regel toe:
guestinfo.stctlvm.version = "3.0.6-3"
Druk op de ESC-toets en typ :wq om de wijzigingen op te slaan.
Identificeer de virtuele machine-ID (VMID) van de SCVM met de opdracht vim-cmd vmsvc/getallvms en herlaad het configuratiebestand van de SCVM:
[root@San-Jose-Server-1:~] vim-cmd vmsvc/getallvms
Vmid Name File Guest OS Version Annotation
1 stCtlVM-FCH2119V1NH [SpringpathDS-FCH2119V1NH] stCtlVM-FCH2119V1NH/stCtlVM-FCH2119V1NH.vmx ubuntu64Guest vmx-15
[root@San-Jose-Server-1:~] vim-cmd vmsvc/reload 1
Opnieuw laden en inschakelen van de SCVM met deze opdrachten:
[root@San-Jose-Server-1:~] vim-cmd vmsvc/reload 1
[root@San-Jose-Server-1:~] vim-cmd vmsvc/power.on 1
Waarschuwing: in dit voorbeeld is de VMID 1.
U moet wachten tot het HX-cluster weer gezond is voordat u naar de volgende SCVM gaat.
Herhaal dezelfde procedure voor de betrokken SCVM's één voor één.
Log tot slot in elke SCVM met SSH en switch om gebruikersaccount te openen. Start stMgr één knooppunt per keer opnieuw met deze opdracht:
diag# priv restart stMgr
stMgr start/running, process 22030
Zorg ervoor dat stMgr, voordat u naar de volgende SCVM gaat, volledig gebruiksklaar is met deze opdracht:
diag# stcli about
Waiting for stmgr management server on port 9333 to get ready . .
productVersion: 5.0.2d-42558
instanceUuid: EXAMPLE
serialNumber: EXAMPLE,EXAMPLE,EXAMPLE
locale: English (United States)
apiVersion: 0.1
name: HyperFlex StorageController
fullName: HyperFlex StorageController 5.0.2d
serviceType: stMgr
build: 5.0.2d-42558 (internal)
modelNumber: HXAF240C-M4SX
displayVersion: 5.0(2d)
Gerelateerde informatie
Waarschuwing: in dit voorbeeld is de VMID 1.