Einleitung
In diesem Dokument wird das proaktive RMA-System beschrieben. Cisco nutzt Telemetriedaten von vernetzten Produkten und kann so ein nahezu nahtloses Kundenerlebnis bieten, wenn bei Produkten bestimmte Fehler auftreten. Ohne menschliche Interaktion werden ein Service Request (SR) und eine Return Material Authorization (RMA) proaktiv genehmigt, um die Zeit vom Ausfall bis zum Austausch erheblich zu verkürzen. Dieses Dokument enthält Informationen zu diesem Programm, zu den erforderlichen Maßnahmen für Kunden, zu den Geräten/Problemen, die von diesem Programm abgedeckt werden, und zu den verfügbaren Konfigurationen (Abmelden, Kontaktkonfiguration).
Anforderungen
- Das betroffene Gerät muss entweder direkt mit der Intersight Cloud verbunden und von dieser entweder über eine verbundene virtuelle Appliance angefordert werden (seit Juli 2012 unterstützte Appliance). Siehe Intersight Getting Started guide (Leitfaden für Erste Schritte), um ein Gerät anzuschließen und in Anspruch zu nehmen. Private virtuelle Appliances werden nicht unterstützt. Im Abschnitt zu Nutanix finden Sie Hinweise und Voraussetzungen zu diesen Geräten.
- Für verbundene virtuelle Appliances muss die proaktive RMA aktiviert sein. Weitere Informationen hierzu finden Sie hier.
- Das betroffene Gerät muss durch einen gültigen Supportvertrag abgedeckt sein (Beispiel: Smart Net Total Care (SNTC) für den Hardware-Ersatz.
- Für Intersight SaaS ist keine Lizenz erforderlich (keine Lizenzstufe), Essentials ist für die Connected Virtual Appliance (CVA) mindestens erforderlich.
Umfang
Alle Kunden und alle Geräte, die die genannten Anforderungen erfüllen, sind im Lieferumfang enthalten. Dieses Programm wird auf der Basis eines Opt-out durchgeführt. Um jedoch auf verbundenen virtuellen Appliances ausgeführt zu werden, muss die Funktion für proaktive RMAs aktiviert sein. Neben den in diesem Dokument erwähnten Fehlertypen werden in diesem Programm weitere Hardware-Fehlerszenarien/-fehler berücksichtigt.
Speicherfehler
UCS-Speicherfehler (DIMM Inoperating Fault F0185, IMM Fault code MemoryUnitUnCorrectableError). Diese stehen für nicht korrigierbare Fehler sowie für DIMMs im gleichen Kanal zu DIMMs, bei denen ein nicht korrigierbarer Fehler (UECC) aufgetreten ist. Bei DIMMs, die sich im gleichen Kanal befinden, tritt vor Version 4.2(2a) ein F0185-Fehler auf. Sie sind jedoch noch nicht ausgefallen und werden nicht ausgetauscht. Weitere Informationen zu diesem Verhalten finden Sie unter Cisco Bug-ID CSCvt29521. Anmerkung: Alle Management-Modi (Standalone, UMM - UCSM Managed Mode, IMM - Intersight Managed Mode) werden für diesen Fehlertyp unterstützt.
Hinweise:
- Server, bei denen mehr als ein heruntergestufter/nicht funktionsfähiger DIMM-Fehler auftritt, sind nicht abgedeckt. Kunden müssen zur Lösung dieser Probleme manuell ein Ticket öffnen.
- Instanzen der Cisco Bug-ID CSCvo48003 ("M4 Blade - Patrol Scrubber logs DIMM address with 4k border") oder der Cisco Bug-ID CSCvo48006 ("M4 Rack - Patrol Scrubber logs DIMM address with 4k border") sind ausgeschlossen. Kunden können hierfür ein TAC-Ticket erstellen und die Auswirkungen von Bugs auf ihre Umgebung bewerten.
UCS-Laufwerksfehler
UCS-Festplattenausfälle (UCS-Fehlercodes F1732, F0181, F0996 und IMM-Fehlercodes StoragePhysicalDiskFailed, StoragePhysicalDiskOffline, StoragePhysicalDiskPredictiveFailure, StoragePhysicalDiskSelfTestFail und StoragePhysicalDiskUn ConfiguredBad) werden von dieser Funktion abgedeckt. Laufwerke mit dem Status "Vorhersehbarer Fehler" oder "Fehlgeschlagen" lösen diese Fehler aus und sind abgedeckt.
Hinweise:
- Festplatten mit Fehlern, jedoch in einem scheinbaren nicht ausgefallenen Zustand (Beispiel: Fremdkonfigurationen, Copyback, Umbauten usw.) sind ausgeschlossen.
- Festplatten, die einen Passthrough- oder Nicht-RAID-HBA-Speichercontroller verwenden, oder Festplatten im JBOD-Modus verfügen selten über ausreichende Protokollnachweise in den Dateien des technischen Supports, um festzustellen, ob eine Festplatte ausgefallen ist, und werden nicht ersetzt, wenn keine Beweise gefunden werden können. Ein Teil der Festplattenausfälle auf Nicht-RAID-HBAs verursachen einen entsprechenden Fehler und verfügen über ausreichende Protokollnachweise, um einbezogen zu werden. In den Abschnitten Hyperflex Drive Failure und Nutanix Drive Failures finden Sie Informationen zu Situationen, in denen HBA-Passthrough-Laufwerke unterstützt werden.
Fehler bei HyperFlex-Laufwerk
Dauerhaft ausgefallene Zwischenspeicherung und persistente Festplatten in Hyperflex (manchmal auch als: Blacklists / Failed Permanently / Reished) werden von dieser Funktion abgedeckt.
Anmerkung: Der Cluster wird automatisch repariert, und es wird eine Fehlermeldung ausgegeben, kurz nachdem der Datenträger ausgefallen ist. In diesen Fällen muss ein Datenträger dennoch ausgetauscht werden.
Hinweise:
- Cluster mit mehreren Festplattenausfällen werden nicht eingeschaltet.
- Laufwerke, die mit FN70234 übereinstimmen, werden ausgeschlossen.
- Laufwerke, die mit den Modellen übereinstimmen, die von der Cisco Bug-ID CSCvo58565 betroffen sind, werden ausgeschlossen.
Lüfterausfälle bei C-Serie
Lüfterausfälle innerhalb eines Servers der C-Serie, der sich im Standalone-, UMM- (UCSM Managed Mode) oder IMM-Modus (Intersight Managed Mode) befindet, werden unterstützt. Fehlercodes: F0484, F0397, F0794 fallen in den Anwendungsbereich.
Hinweise:
- Mehrere Lüfterausfälle zur gleichen Zeit sind wahrscheinlich kein echter Lüfterhardwareausfall und werden derzeit nicht unterstützt.
- Bei vorübergehenden Lüfterausfällen wird kein proaktiver RMA-Fall generiert.
Lüfterausfälle bei Fabric Interconnect
Lüfterausfälle in einem Fabric Interconnect, der sich im UMM (UCSM Managed Mode) befindet, werden unterstützt. Fehlercodes: F0484, F0397 liegen im Geltungsbereich.
Hinweise:
- Von IMM verwaltete FIs werden noch nicht unterstützt
- Mehrere Lüfterausfälle zur gleichen Zeit sind wahrscheinlich kein echter Lüfterhardwareausfall und werden derzeit nicht unterstützt.
Nutanix-Laufwerksfehler
Ausgefallene Laufwerke in Nutanix-Clustern auf Cisco Hardware werden unterstützt.
Hinweise:
- Nutanix Cluster muss mit Nutanix Cloud verbunden werden
- Nutanix BreakFixContact E-Mail muss konfiguriert werden, oder die Hardware muss mit Intersight verbunden werden.
- Der Nutzer aus dem BreakFixContact oder aus Intersight muss berechtigt sein, Tickets für den Vertrag über den jeweiligen Server zu eröffnen.
Details zum Angebot
Wenn ein abgedecktes Fehlerereignis auftritt, werden ein Serviceticket (SR) und eine RMA generiert. Interessante Punkte:
- E-Mails werden von sherholm@cisco.com versendet.
- Ticket wird entweder mit der konfigurierten E-Mail (siehe Abschnitt zur erweiterten Konfiguration unten) oder dem zuletzt berechtigten Benutzer erstellt, der sich bei Intersight angemeldet hat.
- Die anderen Benutzer des Intersight-Kontos, die im Rahmen des Vertrags berechtigt sind, werden in die E-Mail kopiert. Wenn Benutzer explizit konfiguriert sind (über Tags, siehe Abschnitt Erweiterte Konfiguration (optional)), erhalten nur konfigurierte Benutzer die E-Mail.
- Jeder berechtigte Benutzer kann die RMA selbst übernehmen und die erforderlichen Angaben machen. Das RMA-Tool umfasst eine Option für die Übertragung von Eigentumsrechten.
- Das Cisco RMA-Tool (Product Returns and Replacement - PRR) sendet dem Benutzer, mit dem das Ticket geöffnet wurde, eine Erinnerung zum Ausfüllen des RMA-Entwurfs.
Nach der Erstellung der Serviceanfrage erhalten Kunden eine E-Mail, in der das Problem beschrieben und die erforderlichen Schritte beschrieben werden. Hier ein Beispiel:
From: sherholm@cisco.com
To: bob@example.com
Subject: [Action Required] SR: 600000000 - Proactive Replacement of Memory Module [Connected via Intersight]
Hello Bob,
I am writing to let you know that Cisco has received a fault message from your Cisco UCS server connected by Cisco Intersight.
The fault indicates that a memory DIMM module has failed and needs replacing. I have automatically created a TAC Case for
you (SR 600000000) and have created the RMA to ship you the replacement DIMM. I just need you to click the RMA link and
verify your shipping address so the replacement part can be shipped out to you: https://ibpm.cisco.com/rma/home/?RMANumber=800000000
Note: If you have difficulty loading the link above, please contact LSC at one of the following manners:
https://www.cisco.com/c/en/us/buy/logistics-support-center.html
Here is some more information about the failed DIMM and the server it's installed in:
Domain Name: ucs-domain
Domain IP Address: 192.0.2.1
Server Serial Number: SERIAL
Server Name: HOSTNAME
Server Service Profile: org-root/SERVICEPROFILENAME
Server User Label: USER_LABEL
Fault Description: DIMM DIMM_H1 on server 1/1 operability: inoperable
Link to server in Intersight: https://intersight.com/an/compute/physical-summaries/moid/server/
Link to Fault in Intersight: https://intersight.com/an/cond/alarms/?Moid=moid
Hardware replacement guide available here:
<link to replacement guide for the specific server type>
For more information on this feature of Intersight see:
<link to this document>
Please let me know if you have further questions,
Sincerely,
Sherlock
Technical Consulting Engineer, Virtual
Cisco Customer Experience
Email: sherholm@cisco.com
Vorteile
- Erheblich reduzierter Aufwand für den Erhalt eines Ersatzteils.
- Automatische Erstellung von SR - schnellere Reaktion auf Ereignisse.
- Vorabgenehmigung der RMA.
- Möglichkeit zum Ausfüllen der RMA-Daten direkt nach Kontaktaufnahme
- Automatische Erfassung zielgerichteter Diagnosedaten.
- Ausschluss von Softwaredefekten - Softwarefehler, die als Hardwarefehler erscheinen, führen nicht zu unnötigen RMAs.
Weitere Details
Workflow-Details
Erweiterte Konfiguration (optional)
Zurzeit werden zwei erweiterte Konfigurationsoptionen unterstützt. Konfigurationsoptionen werden in Intersight über Tags festgelegt.
Die in diesem Abschnitt beschriebenen Tags können an jedem der in Intersight aufgeführten Objekte konfiguriert werden:
- Konto (über GUI)
- Organisation (über API)
- Zielgerät/Registriertes Gerät (über API)
Für Kunden mit der Connected Virtual Appliance können Tags entweder auf der Appliance selbst oder in der Intersight Cloud konfiguriert werden.
Weitere Informationen zu Einstellungs-Tags finden Sie im Dokument Setting Tags in Intersight.
Explizite Konfiguration eines Kontakts
Kunden können die E-Mail-Adresse(n), die sie mit dem Serviceticket und der RMA verknüpfen möchten, explizit konfigurieren. Der Tag-Name/-Schlüssel lautet "AutoRMAEmail", und der Wert ist eine CSV-Liste mit E-Mails, die Sie benachrichtigen und zur Bearbeitung berechtigen möchten. Die proaktive RMA verwendet die Methode des ersten Abgleichs und analysiert E-Mails auf einer von links nach rechts verlaufenden Weise. Wenn Sie beispielsweise "user@example.com,user2@example.com" verwenden, wird zunächst versucht, user@example.com zu öffnen, es werden jedoch alle E-Mails kopiert.
Anmerkung: Warnung: Um ein Ticket zu öffnen, muss mindestens eine E-Mail in der CSV-Liste mit einem gültigen CCO-Konto verknüpft sein, das mit dem Vertrag verknüpft ist, unter den die Seriennummer des Geräts fällt.
Wenn also keine der AutoRMAEmail-Adressen in dem Vertrag enthalten ist, der das Gerät abdeckt, werden die AutoRMAEmail-Adressen ignoriert.
Proaktive RMA greift auf das Standardverhalten zurück, bei dem E-Mails an alle Personen versendet werden, die über ein Intersight-Konto verfügen und mit dem Vertrag verbunden sind, der das Gerät abdeckt.
Bitte beachten Sie, dass Intersight für Tags mit 255 Zeichen eine Zeichenbeschränkung hat. Daher unterstützt die proaktive RMA alle Tags, die mit AutoRMAmail beginnen (z. B.: AutoRMAEmail1, AutoRMAEmail2) und verknüpft alle Werte miteinander.
Wenn Sie die API zum Konfigurieren von Tags verwenden, muss das Tag ähnlich aussehen wie:
{"Key":"AutoRMAEmail","Value":"email1@example.com,email2@example.com"}
Weitere Informationen finden Sie im Dokument Setting Tags in Intersight (Festlegen von Tags in Intersight).
Von proaktiven RMAs abmelden
Abmelden,
Wenn Sie die API verwenden, muss das Tag wie abgebildet sein.
{"Key":"AutoRMA","Value":"False"}
Um sich wieder für proaktive RMAs zu entscheiden (falls diese Option deaktiviert ist), können Benutzer entweder den Tag ganz entfernen oder den Tag wie folgt ändern:
{"Key":"AutoRMA","Value":"True"}
Hinweis: Benutzer müssen sich NICHT über Tags anmelden, wenn sie sich nicht angemeldet haben. Sie werden automatisch aktiviert, wenn sie sich nicht angemeldet haben.
Häufig gestellte Fragen
F: Welche Informationen erfasst Cisco für diese Fehler?
A : Fehlerdetails (Zeit/Gerät/etc.), Inventarinformationen (Modell / Seriell / Firmware), zutreffende Diagnosedaten (z.B.: Technische Unterstützung für CIMC/UCSM/HX).
F: Wie lange dauert die Reaktion?
A : Tickets werden in der Regel innerhalb einer Stunde nach Auftreten des Fehlers geöffnet und die RMA erstellt. Dazu gehört auch die gesamte Zeit, die zum Generieren und Verarbeiten der entsprechenden Diagnosedaten benötigt wird.
F: Wer kann die RMA einsenden?
A : Jeder berechtigte Benutzer des Vertrags, durch den das Gerät abgedeckt ist, kann die RMA einreichen. Dabei muss es sich nicht um dieselbe Person handeln, die bei der TAC-Serviceanfrage als Kontakt fungiert. Die RMA ist anfänglich einem spezifischen CCO-Konto zugeordnet. Benutzer, die die RMA ausfüllen möchten, können auf die Schaltfläche "Actions" (Aktionen) in der rechten oberen Ecke der RMA klicken und "Transfer Assignment" (Zuweisung übertragen) auswählen. Belassen Sie auf dem nächsten Bildschirm Ihre CCO-Angaben im Eingabefeld, und klicken Sie auf "Submit" (Senden).
F: Wenn beim Laden der RMA ein Fehler auftritt, wie kann ich diese RMA einsenden?
A : Gelegentlich können veraltete Cookies/Browser-Cache Probleme beim Laden der RMA verursachen, versuchen Sie bitte zunächst, die RMA in einem privaten Browserfenster oder einem anderen Browser zu laden. Wenn das Problem weiterhin besteht, senden Sie uns bitte eine E-Mail mit der Bitte um Hilfe.