Inleiding
Dit document beschrijft het gebruik van de verborgen CLI-opdrachtreparatiewachtrij en de acties die plaatsvinden wanneer deze opdracht wordt gegenereerd vanuit de CLI van een Cisco Email Security Applicatie (ESA).
Voorwaarden
Vereisten
Cisco raadt kennis van de volgende onderwerpen aan:
- Systeemcapaciteit, systeembewaking, systeemgezondheid en algemene verwerking van berichten via de ESA-werkwachtrij.
- Totale ESA toediening.
Opmerking: raadpleeg de ESA User Guide of de Online Help van de ESA GUI voor meer informatie.
Gebruikte componenten
De informatie in dit document is gebaseerd op de volgende software- en hardware-versies:
- ESA, alle hardware en virtuele apparaten met AsyncOS 11.0.0-264 of nieuwer
De informatie in dit document is gebaseerd op de apparaten in een specifieke laboratoriumomgeving. Alle apparaten die in dit document worden beschreven, hadden een opgeschoonde (standaard)configuratie. Als uw netwerk live is, moet u de potentiële impact van elke opdracht begrijpen.
Probleem
Redenen om de opdracht reparatiewachtrij uit te voeren:
- Fout bij opgeven dat de werkrij niet is gekoppeld. Dit is meestal het gevolg van beschadiging van de wachtrij na een onjuist stroomprogramma of het opnieuw opstarten van het apparaat.
- Bekende defect vereist dit als tijdelijke oplossing (zoals CSCuw2284 - Email wachtrij corrupt na hermes crash of ongepaste sluiting).
- Toepassingsfouten, zoals die met betrekking tot "gcq.py", of het subsysteem wachtrijbeheer.
- Status Detail of werkrij > tarief melden negatieve getallen.
- Status of Status Detail meldt "Oudste bericht" ouder dan uw bounce profiel. De standaardwaarde hiervoor is 3 dagen. U kunt controleren van bounceconfig > bewerken en het standaardprofiel kiezen. U zoekt het maximum aantal seconden dat een bericht in de wachtrij mag blijven voordat het hard stuiteren is, dat standaard 259200 seconden of 3 dagen is. Dit sluit de virtuele leveringsdomeinen uit, de.<destroom>.wachtrij zoals de.cpq.wachtrij, de.euq.wachtrij, de.cpq.release.host.
Redenen om de opdracht reparatiewachtrij NIET uit te voeren:
- Langzame werkwachtrijverwerking is geen geldige reden om een wachtrijreparatie uit te voeren. Beheerders verwarren langzame verwerking in werkrijen vaak met corruptie in wachtrijen. Een trage werkrij is meestal het gevolg van herhaalde verwerking van hetzelfde bericht(en) vanwege overbenutting van systeembronnen. Vaak zijn deze herhaalde verwerkingsscenario's niet dingen die worden gerepareerd door simpelweg reparatiewachtrij uit te voeren. Er is verdere probleemoplossing vereist voor de service(s) waarbij een bericht tijdens de verwerking wordt "gehangen".
Gebruik van de opdrachtreparatiewachtrij
Het uitvoeren van de CLI commando reparatie wachtrij kan niet alle werkwachtrij problemen of corruptie te herstellen. Dit hulpprogramma doet zijn best om de werkvoorraad te repareren.
Waarschuwing: ESA-beheerders moeten nota nemen van de mogelijkheid om actieve berichten uit een werkrij te verliezen.
Wanneer reparatiewachtrij wordt uitgevoerd, vraagt de eerste procesrun eenmaal om toestemming om de reparatie voort te zetten en uit te voeren:
myesa.local> repairqueue
Do you want to repair or clean the queue?
1. Repair.
2. Clean.
[1]> 1
The mail flow will be stopped through out the repair/cleanup process
WARNING:
This utility does a best effort to repair the queue.
Not all queues corruptions can be repaired.
Are you sure you want to proceed? [N]> y
Checking generation checksum files
...
<<<SNIP FOR BREVITY>>>
...
done
Repair succeeded
Starting Hermes
Hermes Started
Log into the system and verify the status of the system.
Opmerking: Op een virtuele ESA, negeer de volgende uitvoer, bekend defect (CSCuz28415): "Wachten op de wachtrij om te monteren: Kan apparaat niet openen op /dev/ipmi0 of /dev/ipmi/0 of /dev/ipmidev/0: Geen dergelijk bestand of map"
Als het reparatieproces is voltooid, wordt de werkvoorraad gerepareerd. Het apparaat behoudt echter nog steeds een oude controlepost van de vorige werkvoorraad. Om het schrijven van een nieuwe controlepost voor werkwachtrijverwerking te hervatten, voer de herstellingswachtrij opnieuw uit en geef de opdracht Reinigen uit:
myesa.local> repairqueue
Do you want to repair or clean the queue?
1. Repair.
2. Clean.
[1]> 2
The mail flow will be stopped through out the repair/cleanup process
WARNING:
There is a backup found this may be the only backup.
This will to remove the old queue.
Are you sure you want to proceed? [N]> y
Double confirmation. Are you sure you want to proceed? [N]> y
Removing old queue
Cleanup finished
Verifiëren
Voer na het invullen van de reparatiewachtrij elk van de volgende handelingen uit om te controleren of de werkwachtrij weer online staat en het apparaat e-mail verwerkt:
- Controleer de systeemstatus door de opdracht statusdetails uit te voeren via de CLI of Monitor > Systeemstatus via de GUI. Het apparaat moet de systeemstatus van Online weergeven.
- Bekijk de e-maillogbestanden op het apparaat om de verwerking van e-mail te garanderen zoals verwacht. Dit kan vanuit de CLI worden bereikt door de opdracht tail mail_logs uit te voeren.
- Voer de opdracht werkwachtrij uit vanuit de CLI en kies de optie Snelheid met een standaardsnelheid van 10 seconden. Zolang het apparaat e-mail in- en/of uitgaande verwerkt, moet het tarief per 10 seconden tamelijk gelijk zijn voor de in/uit-verhouding. Applicaties met een grote wachtrij voor verwerking kunnen enige tijd in beslag nemen om de werkrij te legen en de normale verwerking te hervatten.
FAQ
Wat als mijn ESA niet draait 11.0.0-264 of nieuwer?
Klanten die apparaten hebben waarop oudere versies van AsyncOS worden uitgevoerd en die niet de optie voor de verborgen CLI-opdracht voor reparaties hebben, moeten een ondersteuningscase openen om een Cisco Support Engineer-assistent te hebben. Er moet een ondersteuningstunnel worden geopend en beschikbaar zijn voor Cisco-ondersteuning om het apparaat te kunnen gebruiken en het proces van de reparatiewachtrij uit te voeren. Neem contact op met Cisco ondersteuning om een actieve ondersteuningscase te openen.
Betekent 'corruptie' in de werkvoorraad het verlies van e-mail?
In de meeste gevallen is corruptie niet gelijk aan verlies van e-mail. De wachtrij is beschadigd vanwege metagegevens in verband met berichten die niet meer op het apparaat worden verwerkt. Dit is een boekhoudkundige verwerking tussen de wachtrij en rapportage, het bijhouden van berichten, etc. Het runnen van de reparatiewachtrij zal de ESA meta-data herbouwen en eventuele foutieve rapportage tussen de diensten en de verwerking opruimen.
Heeft corruptie in de werkvoorraad gevolgen?
De ESA kan lange tijd kunnen werken op een beschadigde wachtrij en de meeste berichten kunnen fijn verwerken, maar het apparaat kan traag lijken of bepaalde berichten kunnen nooit leeg raken, zoals wordt aangegeven door het "Oudste bericht" in de statusopdracht — aanzienlijk ouder dan de bounceconfig zou toestaan. Wanneer AsyncOS daadwerkelijk opnieuw opgestart is met een beschadigde wachtrij, kan de wachtrij al dan niet kunnen worden gekoppeld. De beschadiging kan enige tijd geleden hebben plaatsgevonden en lijkt prima te zijn totdat het apparaat opnieuw is opgestart, waarna het niet in de wachtrij kan worden geplaatst.
Wat veroorzaakt corruptie in de rij?
De twee meest voorkomende oorzaken van 'wachtrijcorruptie' zijn:
- Onverwachte herstart van het apparaat. Onderbrekingen van de voeding of het ingedrukt houden van de aan/uit-knop kan leiden tot een onfatsoenlijke sluiting en kan de wachtrij beschadigen, afhankelijk van wat backend-processen op dat moment deden. Het apparaat kan zich herstellen en de wachtrij kan beschadigd terugkomen, of de wachtrij kan niet worden gemonteerd als de wasmachine opnieuw wordt opgestart. Als dit waar is, zullen ESA-beheerders "wachtrij niet gemonteerde" waarschuwingen en/of "daemon niet reageren" zien bij het uitvoeren van status vanuit de CLI.
myesa.local> status
Enter "status detail" for more information.
Couldn't obtain mail stats - my.esa: The daemon is not responding.
myesa.local> status
Enter "status detail" for more information.
Couldn't obtain mail stats - the queue is not mounted
- Uitgaand RAM-gebruik door het apparaat. Dit wordt waarschijnlijk veroorzaakt door een verkeerde configuratie van het luisteraar- en/of mailstroombeleid, dat meestal wordt gezien bij te veel inkomende verbindingen/injecties toegestaan. Cisco raadt aan om uw listenerconfig te bekijken voor maximale inkomende verbindingen. Cisco raadt aan dit op 300 in te stellen.
Hoe lang moet het reparatiescript duren om te voltooien?
Het repareren van de werkrij kan van 10 seconden tot enkele uren duren, afhankelijk van de status van de ESA en hoeveel berichten momenteel door een actieve werkrij worden verwerkt. Een reparatie van een werkrij op een apparaat in de lagere regionen met volledige wachtrijen op het moment van corruptie kan een paar uur duren.
Wat gebeurt er als de reparatiewachtrij niet kan starten of niet voltooid is?
In bepaalde situaties (bijvoorbeeld een te volledige wachtrij op een apparaat) kan de reparatievrij niet worden ingevuld. Als de reparatiewachtrij niet binnen 4 uur klaar is, is de wachtrij waarschijnlijk onherstelbaar en de enige mogelijkheid is om een nieuwe wachtrij op te bouwen door de verborgen CLI commando resetwachtrij uit te voeren. Voor geavanceerde problemen kunt u contact opnemen met Cisco Support om een actieve ondersteuningscase te openen en u te laten assisteren door Cisco Support.
Gerelateerde informatie