In questo documento vengono evidenziati i vari metodi e le funzionalità di protezione dal sovraccarico di Mobility Management Entity (MME) disponibili su Cisco Aggregation Services Router (ASR) serie 5000. In ASR serie 5000, Cisco offre al cliente vari mezzi per ottenere il controllo e questo articolo spiega le funzionalità e i comandi CLI correlati.
La limitazione della velocità di collegamento protegge gli elementi di rete adiacenti, ad esempio il server HSS (Home Subscriber Server), la funzione PCRF (Policy and Charging Rules Function) e il server di caricamento online (OCS), nonché le risorse MME interne, ad esempio imsimgr e sessmgr. Attach Rate Throttling elabora le nuove chiamate che arrivano a imsimgr, come ad esempio le chiamate Attachments e Inter-MME/Serving GPRS Supporting Node (SGSN) Tracking Area Update (TAU).
Nell'immagine è illustrato il flusso dei messaggi per le chiamate e le code di limitazione.
Per proteggere MME (imsimgr e sessmgr in avanti), è necessario definire la frequenza di limitazione, il tempo di attesa della coda e il tempo di dimensione della coda. La velocità di limitazione dipende dal modello di chiamata MME, in quanto la capacità MME dipende dal modello di chiamata.
Per MME il calcolo della velocità di limitazione è relativamente semplice, prendere gli eventi di chiamata standard al secondo (CEPS) nella rete più la tolleranza. Inoltre, potrebbe essere necessario considerare la capacità del database HSS anche se è necessaria la protezione HSS.
Esempio
Nelle ore di maggiore attività, MME gestisce fino a 170-200 chiamate al secondo (Attachments+ Inter TAU). In caso di guasto di un sito, un MME potrebbe ricevere fino a 350-370 chiamate al secondo. Con questa frequenza di chiamate, l'utilizzo di MME aumenta di circa l'80% e 400 chiamate al secondo è un livello ottimale per limitare la frequenza di limitazione al fine di evitare un carico di segnalazione eccessivo all'interno della scatola MME.
Il tempo di attesa della coda per impostazione predefinita è di 5 secondi. È la soluzione ottimale per il CLIENTE. Per impostazione predefinita, la dimensione della coda è 2500. È la soluzione ottimale per il CLIENTE.
Il comando di configurazione è il seguente.
asr5k(config)#network-overload-protection mme-new-connections-per-second
new_connections action attach { drop | reject-with-emm-cause
{ congestion | network-failure | no-suitable-cell-in-tracking-area}
tau { drop | reject-with-emm-cause { congestion | network-failure
| no-suitable-cells-in-tracking-area | no-sec-ctxt-in-nw} fwd-reloc
{ drop | reject} }{wait-time <wait-time>} {queue-size <queue-size>}
nuove_connessioni
Definisce il numero di nuove connessioni MME da accettare al secondo. Deve essere un numero intero compreso tra 50 e 5000. Il valore predefinito è 500.
azione
Definisce l'azione da eseguire quando la coda di attesa diventa piena. Ogni volta che vengono ricevute nuove connessioni dall'MME, queste vengono accodate nella coda di attesa e imsimgr elabora i messaggi dalla coda alla velocità configurata. Quando la coda esegue un overflow (a causa di un'alta velocità in ingresso), in base all'"azione" configurata, i pacchetti vengono scartati o rifiutati.
dimensioni-coda
Definisce le dimensioni massime della coda di attesa utilizzata per l'archiviazione dei pacchetti. Deve essere un numero intero compreso tra 250 e 25000. Il valore predefinito è 2500.
Esempio di configurazione
network-overload-protection mme-new-connections-per-second 400 action attach
reject-with-emm-cause no-suitable-cell-in-tracking-area tau
reject-with-emm-cause no-suitable-cell-in-tracking-area fwd-reloc drop
Ora la velocità delle chiamate al secondo è impostata su 400 e l'azione è un rifiuto intelligente con causa #15 per far sì che l'Apparecchiatura Utente (UE) si riconnetta a diverse Tecnologie di Accesso Radio (RAT). Il tempo di attesa è impostato sul valore predefinito (5 secondi) e la dimensione della coda è 2500.
Paging Throttling protegge le risorse MME interne (mmemgr) come risorse eNodeB/radio (se necessario). Questa soglia di tasso limite è applicabile a tutti gli eNodeB che si associano a MME per un determinato chassis ASR 5000. Le richieste di paging S1 a un eNodeB sono limitate a questa soglia. Le richieste di paging S1 a un eNodeB che superano questa soglia vengono eliminate.
Per MME il calcolo della velocità di limitazione è relativamente semplice, prendere la velocità di paging in uscita standard nella rete più la tolleranza. (Questa operazione è basata esclusivamente sulla decisione del team di progettazione).
Esempio
Nelle ore di maggiore attività, ogni MME gestisce fino a 35.000 messaggi di paging al secondo. In caso di guasto di un sito, è possibile che un MME trasferisca fino a 70.000 pagine al secondo. Con questa velocità di paging, l'utilizzo di MME (mmemgr) aumenta di circa l'80% e 70000-80000 pagine al secondo sarebbe un livello ottimale per limitare la velocità al fine di evitare un'eccessiva segnalazione S1 su mmemgr.
Tuttavia, il tasso è limitato per eNodeB medio. La velocità media per eNodeB (nel caso di 6500 eNodeB) è di 10 pagine al secondo. Tuttavia, le aree di rilevamento (TA) non sono uguali nel numero di sottoscrittori e vari TA/membri eNodeB sono caricati con paging diverso. Nel caso in cui la differenza tra le dimensioni di AT e il numero medio di sottoscrittori per TA sia raddoppiata, la tariffa per eNodeB sarebbe 20. Nel caso di 20 volte la differenza tra le dimensioni di TA e il numero medio di sottoscrittori per TA, la tariffa per eNodeB sarebbe 200. Ciò significa che la funzione diventa più efficiente nei casi in cui TA (in numero di sottoscrittori) è caricato uniformemente.
Un'altra azione da eseguire in parallelo è l'attivazione del paging intelligente. Fare riferimento alla sezione "TAI mgmt db and LTE Paging" nella ASR 5000 ME Administration Guide.
Il comando di configurazione è il seguente:
asr5000(config)# network-overload-protection mme-tx-msg-rate-control enb s1-paging
network-overload-protection mme-tx-msg-rate-control enb s1-paging 200
La limitazione DDN (Downlink Data Notification) è una funzione che consente di controllare la frequenza delle richieste DDN a MME dal lato SGW (Serving GateWay). Protegge le risorse MME come mmemgr e sessmgr dai picchi di DDN (Ingress Paging Request).
Questa funzione è composta da due parti, una per i moduli MME conformi a Rel-10 e l'altra per i moduli MME non conformi a Rel-10:
Quando questa funzione è abilitata su SGW, invia una filigrana ARP in DDN Req a ME. In risposta, MME invia l'unità di ritardo di limitazione, il valore di ritardo di limitazione e il fattore di limitazione. La combinazione di Valore ritardo e Unità ritardo calcola il Tempo di limitazione. Alla ricezione di questi valori, SGW elimina la richiesta DDN per un determinato ARP fino alla scadenza del timer di limitazione.
Per gli MME non conformi Rel-10 che utilizzano la configurazione locale, SGW limita DDN Req con una filigrana ARP particolare.
Cisco ASR5x00 MME release 16 e 17 non supportano la limitazione DDN automatica, quindi funziona come non conforme alla Rel 10 in termini di limitazione DDN.
Specifiche tecniche (TS) 23.401, riferimento per MME:
Limitazione delle richieste DDN
In circostanze insolite (ad esempio quando il carico MME supera una soglia configurata dall'operatore), l'MME potrebbe limitare il carico di segnalazione che i suoi SGW generano su di esso, se configurato per farlo.
L'MME può rifiutare le richieste DDN per il traffico a bassa priorità per gli utenti in modalità inattiva o per scaricare ulteriormente l'MME. L'MME può richiedere ai SGW di ridurre selettivamente il numero di richieste DDN che invia per il downlink del traffico a bassa priorità ricevuto per gli utenti in modalità inattiva in base a un fattore di limitazione e a un ritardo di limitazione specificato nel messaggio DDN ACK.
L'SGW determina se un vettore è per il traffico a bassa priorità o meno sulla base del livello di priorità ARP e della politica dell'operatore (ossia la configurazione dell'operatore nel SGW dei livelli di priorità ARP da considerare come traffico prioritario o non prioritario). L'MME determina se una richiesta DDN riguarda o meno il traffico a bassa priorità sulla base del livello di priorità ARP ricevuto dal SGW e dai criteri dell'operatore.
Se l'ISR (Idle-state Signaling Reduction) non è attivo per l'UE, durante il ritardo di limitazione l'SGW scarta i pacchetti downlink ricevuti su tutti i suoi portatori a bassa priorità per gli UE noti come non connessi al piano utente (ossia, i dati di contesto SGW indicano che nessun TEID (Tunnel End Identifier) del piano utente downlink è servito da quell'MME in proporzione al fattore di limitazione, e invia un messaggio DDN all'MME solo per i portatori non limitati.
Se ISR è attivo per l'UE durante il ritardo di limitazione, l'SGW non invia DDN all'MME e invia il DDN solo all'SGSN. Se sia MME che SGSN richiedono la riduzione del carico, l'SGW scarta i pacchetti downlink ricevuti su tutti i portatori a bassa priorità per gli utenti noti come non connessi al piano utente (ossia, i dati del contesto SGW indicano che non è presente alcun TEID del piano utente per il downlink) in proporzione ai fattori di limitazione.
L'SGW riprende le normali operazioni alla scadenza del ritardo di limitazione. L'ultimo valore ricevuto del fattore di limitazione e del ritardo di limitazione supera qualsiasi valore precedente ricevuto da tale MME. La ricezione di un ritardo di limitazione riavvia il timer SGW associato a tale MME.
Per SGW rispetto a MME, il calcolo della velocità è relativamente semplice. Utilizza la velocità massima consentita per le pagine in entrata, pari a 1100 messaggi al secondo per casella MME.
I comandi di configurazione sono i seguenti:
#configure
#context saegw-gtp
#sgw-service sgw-svc
#ddn throttle arp-watermark <arp_value> rate-limit <limit> time-factor <seconds>
throttle-factor <percent> increment-factor <percent> poll-interval <second>
throttle-time-sec <seconds> throttle-time-min <minutes> throttle-time-hour <hour>
stab-time-sec <seconds> stab-time-min <minutes> stab-time-hour <hour>
throttle arp-watermark arp_value
Se la filigrana ARP è configurata e un MME/SGSN invia il fattore di limitazione e il ritardo in un messaggio DDN ACK, tutti i DDN con un valore ARP maggiore del valore configurato verranno limitati dal fattore di limitazione per il ritardo specificato.
arp_value è un numero intero compreso tra 1 e 15.
limite di velocità
Configura il limite di velocità (utilizzare questo token e quelli successivi per limitare la velocità solo se l'MME è un MME non release 10).
limit è un numero intero compreso tra 1 e 999999999.
secondi con fattore di tempo
Configura la durata durante la quale il SGW prende decisioni relative alla limitazione.
seconds è un numero intero compreso tra 1 e 300.
percentuale di accelerazione
Configura il fattore di limitazione DDN. Immettere la percentuale di DDN da eliminare al rilevamento di un'sovratensione DDN.
percent è un numero intero compreso tra 1 e 100.
percentuale del fattore di incremento
Configura il fattore di incremento della limitazione DDN. Immettere la percentuale di aumento della limitazione DDN.
percent è un numero intero compreso tra 1 e 100.
secondi intervallo di polling
Configura l'intervallo di polling nella limitazione DDN.
seconds è un numero intero compreso tra 2 e 999999999.
throttle-time-sec secondi
Configura il tempo di limitazione DDN in secondi. Immettere il periodo di tempo in secondi durante il quale le DDN vengono limitate al SGW.
seconds è un numero intero compreso tra 0 e 59.
tempo di accelerazione-minuti
Configura il tempo di limitazione DDN in minuti. Immettere il periodo di tempo in minuti durante il quale le DDN vengono limitate al SGW.
minutes è un numero intero compreso tra 0 e 59.
throttle-time-hour ora
Configura il tempo di limitazione DDN in ore. Immettere il periodo di tempo in ore durante il quale le DDN vengono limitate al SGW.
hour è un numero intero compreso tra 0 e 310.
tempo di tabulazione in secondi
Configura il tempo di stabilizzazione della limitazione DDN in secondi. Immettere un periodo di tempo in secondi durante il quale, se il sistema è stabilizzato, la limitazione verrà disabilitata.
seconds è un numero intero compreso tra 0 e 59.
stab-time-min minuti
Configura il tempo di stabilizzazione della limitazione DDN in minuti. Immettere un periodo di tempo in minuti durante il quale la limitazione verrà disabilitata se il sistema è stabilizzato.
minutes è un numero intero compreso tra 0 e 59.
ora-tabulazione ora-ora
Configura il tempo di stabilizzazione della limitazione DDN in ore. Immettere un periodo di tempo in ore durante il quale, se il sistema è stabilizzato, la limitazione verrà disabilitata.
hour è un numero intero compreso tra 0 e 310.
Esempio di configurazione
ddn throttle arp-watermark 1 rate-limit RATE time-factor 120 throttle-factor 50
increment-factor 10 poll-interval 30 throttle-time-sec 0 throttle-time-min 1
throttle-time-hour 0 stab-time-sec 0 stab-time-min 2 stab-time-hour 0
Questa funzione protegge le risorse MME (sessmgr, mmemgr) e le risorse 4G dalle sovratensioni di errori di percorso Enhanced GPRS Tunneling Protocol (EGTP) in caso di errori di trasmissione nella backbone IP e nel backhaul IP, nonché dall'elemento di rete laterale failures/restarts.The funzione consente di limitare per sessione mgr gli eventi di errore di percorso EGTP rilevati e definisce una maggiore granularità per la gestione del sottoscrittore, oltre alla limitazione di paging S1. A seconda della divisione tra utenti inattivi e connessi, i limiti sono fissati. È molto specifico per la rete e richiede un tuning in relazione allo stato eUTRAN e UE.
Esempio
Gli abbonati vengono suddivisi nelle ore 80:20 da INATTIVO a CONNESSO. Nel peggiore dei casi, l'EGTP PF per gli abbonati IDLE provoca un'ondata di paging che potrebbe causare il sovraccarico di mmemgr, il collo di bottiglia più stretto nella catena. Tale sovraccarico del fattore di paging EGTP (PF) (per gli abbonati IDLE) causa innanzitutto un sovraccarico di paging e questo sovraccarico colpisce il collo di bottiglia di mmemgr, quindi è necessario proteggere mmemgr prima di tutto. Pertanto, l'EGTP PF per IDLE può essere considerato come un'onda di paging in entrata imprevista che può essere al massimo di 1100 pagine al secondo.
Questa configurazione si applica a un servizio EGTP con un tipo di interfaccia "interface-mme".
Il comando di configurazione è il seguente:
asr5000(config)# network-overload-protection mme-tx-msg-rate-control egtp-pathfail ecm-idle
< rate in sessions per second > ecm-connected < rate in sessions per second >
network-overload-protection mme-tx-msg-rate-control egtp-pathfail ecm-idle
1000 ecm-connected 2000
Utilizzando la funzionalità Enhanced Congestion Control, l'MME può segnalare all'eNodeBs a cui è connesso per reindirizzare il traffico ad altri MME nel pool MME. A tale scopo, è necessario eseguire la procedura di sovraccarico dell'interfaccia S1 (TS 36.300 e TS 36.413).
Quando viene configurato il controllo dell'overload e viene raggiunta una soglia di congestione, l'MME può essere configurato per inviare un messaggio di avvio dell'overload dell'interfaccia S1AP a una percentuale degli eNodeB a cui l'MME è connesso. Per riflettere la quantità di carico che l'MME desidera ridurre, questa percentuale è configurabile. Nell'elemento Informazioni risposta sovraccarico (IE, Overload Response Information Element) inviato a eNodeBs, l'MME può richiedere all'eNodeB di rifiutare o consentire tipi specifici di sessioni, tra cui:
La funzione di controllo delle congestioni consente di impostare criteri e soglie e di specificare la modalità di reazione del sistema in caso di sovraccarico. Il controllo della congestione controlla il sistema per individuare le condizioni che potrebbero compromettere le prestazioni quando il sistema è sottoposto a un carico di lavoro elevato. In genere, queste condizioni sono temporanee (ad esempio, elevato utilizzo della CPU o della memoria) e vengono risolte rapidamente. Tuttavia, un numero continuo o elevato di queste condizioni in uno specifico intervallo di tempo può influire sulla capacità del sistema di servire le sessioni dei sottoscrittori. Il controllo della congestione aiuta a identificare queste condizioni e richiama le policy per affrontare la situazione.
Quando si configurano soglie e tolleranze per livelli di congestione critici, principali e secondari, i livelli di soglia e le tolleranze non devono mai sovrapporsi. Si considerino le seguenti configurazioni di esempio, in cui i livelli di soglia non si sovrappongono:
Questa soglia viene calcolata a partire dalla CPU demux del sistema. La soglia viene calcolata in base a un utilizzo medio della CPU di cinque minuti.
Viene preso in considerazione il valore massimo di utilizzo della CPU di due core CPU della CPU demux. Ad esempio, se il core CPU 0 ha un utilizzo CPU di cinque minuti del 40% e il core CPU 1 ha un utilizzo CPU di cinque minuti dell'80%, il core CPU 1 viene preso in considerazione per il calcolo della soglia.
Questa soglia viene calcolata utilizzando la media di utilizzo della CPU in cinque minuti di tutte le CPU (ad eccezione della CPU in standby e della CPU SMC).
Viene preso in considerazione il valore massimo di utilizzo della CPU di due core di tutte le CPU.
Questa soglia viene calcolata in base alla media di utilizzo della memoria in cinque minuti di tutte le CPU (ad eccezione della CPU in standby e della CPU SMC).
Configurazione di un profilo per l'azione di congestione
I profili delle azioni di congestione definiscono un set di azioni che possono essere eseguite dopo il superamento della soglia corrispondente.
Associa un profilo di azione di congestione ai criteri di controllo della congestione
Ogni criterio di controllo della congestione (critico, principale, secondario) deve essere associato a un profilo di controllo della congestione.
Configura controllo overload
Quando viene rilevata una condizione di sovraccarico su un MME, il sistema può essere configurato per segnalare la condizione a una percentuale specificata di eNodeBs ed eseguire l'azione configurata sulle sessioni in entrata.
Sono inoltre disponibili le azioni di sovraccarico seguenti (oltre alle azioni rigetto-nuove-sessioni):
Spiegazione della configurazione di esempio
Ciò abilita la funzionalità di controllo della congestione:
congestion-control
This monitors the overall CPU Utilization including the sessmgr and demux mgrs
congestion-control threshold system-cpu-utilization critical 90
congestion-control threshold system-cpu-utilization major 85
congestion-control threshold system-cpu-utilization minor 80
Memory utilization thresholds:
congestion-control threshold system-memory-utilization critical 85
congestion-control threshold system-memory-utilization major 75
congestion-control threshold system-memory-utilization minor 70
CPU utilization on DEMUX card:
congestion-control threshold service-control-cpu-utilization critical 85
congestion-control threshold service-control-cpu-utilization major 75
congestion-control threshold service-control-cpu-utilization minor 70
Defining tolerance margins:
congestion-control threshold tolerance critical 5
congestion-control threshold tolerance major 5
congestion-control threshold tolerance minor 5
Definizione dei profili delle azioni di congestione (critiche, principali e secondarie)
lte-policy
congestion-action-profile criticalCogestionProfile
reject s1-setups time-to-wait 60
drop handovers
drop combined-attaches
drop service-request
drop addn-brr-requests
drop addn-pdn-connects
exclude-voice-events
exclude-emergency-events
report-overload permit-emergency-sessions-and-mobile-terminated-service enodeb-percentage 50
congestion-action-profile majorCogestionProfile
report-overload permit-emergency-sessions-and-mobile-terminated-service enodeb-percentage 50
congestion-action-profile minorCogestionProfile
report-overload permit-emergency-sessions-and-mobile-terminated-service enodeb-percentage 30
end
Applica criteri di congestione
configure
congestion-control policy critical mme-service action-profile criticalCogestionProfile
congestion-control policy major mme-service action-profile majorCogestionProfile
congestion-control policy minor mme-service action-profile minorCogestionProfile
end
.
Revisione | Data di pubblicazione | Commenti |
---|---|---|
1.0 |
12-Jun-2015 |
Versione iniziale |