Este documento explica problemas de calidad de voz tales como silbar o sonidos estáticos observados durante una conversación de voz. Este documento también proporciona sugerencias para ayudarle a solucionar estos problemas de calidad de voz.
Quienes lean este documento deben tener conocimiento de los siguientes temas:
Comprensión básica de Voz sobre IP (VoIP).
Detección de actividad de voz (VAD) y su aplicación.
La información que contiene este documento se basa en estas versiones de software y hardware.
Cisco IOS® Software Release 12.1 y posterior que ejecuta el conjunto de funciones IP Plus.
Todos los Cisco Voice Gateways
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
Consulte Convenciones de Consejos Técnicos de Cisco para obtener más información sobre las convenciones sobre documentos.
La mayoría de los sistemas de telefonía IP incluyen un detector de actividad de voz. El objetivo del detector es localizar periodos de silencio en la señal de voz y transmisiones de señal discontinuadas temporalmente durante el periodo de silencio. Esto permite ahorrar ancho de banda y permite que el extremo lejano ajuste su memoria intermedia de fluctuación. La disminución se produce en los períodos de silencio, ya que el teléfono del extremo lejano tiene que generar su propia señal para reproducir al oyente. Por lo general, se emite ruido de comodidad al oyente para enmascarar la ausencia de una señal de audio del extremo lejano. El ruido confortable generalmente se modela en el ruido del extremo lejano de manera que no existe un marcado contraste cuando cambia del actual ruido de fondo al ruido confortable.
La figura 1 ilustra un sistema típico de telefonía IP. Los dispositivos de voz IP mencionados pueden ser teléfonos IP, gateway analógicos IP, gateway digitales IP, entre otros.
Figura 1: Sistema de telefonía IP
Durante una llamada entre el dispositivo A y el dispositivo B, el dispositivo A alcanza un intervalo de silencio (Figura 2). El detector de actividad de voz utiliza un algoritmo para determinar si se ha alcanzado un intervalo de silencio. Normalmente, el detector de actividad de voz tiene un periodo de mantenimiento t1 al final de cada ráfaga de discurso. Durante este tiempo continúa enviando paquetes al extremo lejano. Esto ayuda a evitar el switching excesivo y la discordia de la voz. Si se detecta un discurso adicional durante este intervalo de retención, el flujo de voz entre los dispositivos continúa sin interrupciones. Luego de transcurrido un período de tiempo t1 (T2 en la Figura 2 ), el dispositivo de voz a través del IP A deja de enviar paquetes si no se detecta una voz adicional.
Figura 2: Eventos VAD del dispositivo A
En el momento T1 (figura 2), se envía una indicación al dispositivo B que lo alerta sobre el inicio del mantenimiento de VAD. Esto también contiene la duración del mantenimiento de VAD. Cuando se recibe este mensaje, el dispositivo B comienza a atenuar la señal de voz que recibe del dispositivo A bajándola y la mezcla con el ruido confortable generado que debe atenuar subiéndolo (como se muestra en la Figura 3).
Figura 3: Ruido de fondo frente a atenuación de ruido de confort durante el período de retención
Esta atenuación proporciona una transición fluida entre el ruido de fondo real y el ruido de comodidad generado. Realiza las transiciones desde entornos en los que las características del ruido de fondo son muy diferentes a las del ruido de apaciguamiento generado sin problemas y mucho menos notorio. El largo del intervalo de régimen libre VAD (t1) determina cuán efectiva es la técnica. Los intervalos más largos se traducen en transiciones de sonido más suaves.
Si la señal de voz se corta antes de tiempo T2 (Figura 2), la atenuación se detiene inmediatamente y se reproduce el audio entrante de escala completa. Este corte se debe señalizar a través de otra indicación del dispositivo A al dispositivo B. Debido a que el volumen de la señal de voz es considerablemente más alto que el ruido de fondo, enmascara la transición y dicho ruido se hace menos notorio.
La señalización previamente mencionada puede ser en banda (por ejemplo, a través de un nuevo tipo de carga útil en RTP o un evento de señalización denominado), o fuera de banda (por ejemplo, un evento de señalización H.245).
La única causa por la que se escucha un zumbido o estática durante una llamada de voz es la introducción de ruido de comodidad en una conversación. Hay dos posibilidades a las cuales se inyecta ruido de apaciguamiento en una llamada de voz. El principal es el uso de VAD. Siempre que se activa VAD, los paquetes de ruido confortable son introducidos en la corriente de audio. La segunda posibilidad (no la principal) es la activación de una cancelación de eco. Siempre que la cancelación de eco se activa, se introducen los paquetes de ruido de comodidad en la secuencia de audio. Las características de estos paquetes de comodidad se determinan a través de un algoritmo que incluye monitorear la conversación en curso y recibir una firma del ruido de fondo. Este ruido de comodidad es el sonido sibilante.
En esta situación, si el dispositivo A se detiene, el dispositivo B puede experimentar cierto silbido. Esto se puede controlar mediante un ajuste adecuado de los parámetros VAD. Cisco recomienda desactivar VAD si el ajuste fino de estos parámetros no resuelve el problema.
Hay dos parámetros que imponen la funcionalidad VAD:
Se establece un umbral inicial que rige cuando se activa VAD. Esto se controla cuando define el comando music-threshold <threshold_value> en un puerto de voz. El rango para esto es de -70 dBm a -30 dBm. El valor predeterminado es -38 dBm. Si configura un valor inferior (hacia -70 dBm), VAD se activa a una intensidad de señal mucho menor. El volumen debe caer a un nivel realmente bajo antes de ser considerado como silencio. Si configura un valor más alto (más cerca de -30 dBm), VAD se activa incluso para una pequeña caída de la potencia de la señal de voz. Esto impulsa la reproducción para reproducir paquetes de ruido de comodidad con más frecuencia. Sin embargo, esto puede conducir a un recorte menor del audio.
3640-6#configure terminal Enter configuration commands, one per line. End with CNTL/Z. 3640-6(config)#voice-port 3/0/0 3640-6(config-voiceport)#music-threshold ? !--- WORD: Enter a number between -70 to -30. 3640-6(config-voiceport)#music-threshold -50 3640-6(config-voiceport)#end 3640-6# 3640-6#show run | begin voice-port voice-port 3/0/0 music-threshold -50
Una vez que el VAD se vuelve activo, puede controlar el componente del ruido de fondo y el ruido de comodidad cuando configura el comando voice vad-time <timer_value> bajo la configuración global. Este es el tiempo de retardo en milisegundos para la detección y supresión de silencio de la transmisión de paquete de voz. El valor predeterminado para el tiempo de mantenimiento es de 250 mseg. Esto significa que dentro de 250 milisegundos, el ruido de la comodidad comienza por completo. El rango para este temporizador es de 250 ms a 65,536 ms. Si se configura un valor alto, el ruido de comodidad entra en juego mucho después (continúa el ruido de fondo). Si se configura en 65,536 mseg, se apaga el ruido de comodidad. Se requiere un valor superior para este temporizador a fin de lograr una transición más fluida entre el ruido de fondo y el ruido confortable. La desventaja de una configuración de tiempo de vad elevado no está logrando el ahorro deseado de ancho de banda del 30% al 35%.
3640-6#configure terminal Enter configuration commands, one per line. End with CNTL/Z. 3640-6(config)#voice vad-time ? <250-65536>milliseconds 3640-6(config)#voice vad-time 750 3640-6(config)#end 3640-6# 3640-6# 3640-6# 3640-6#show run | begin vad-time voice vad-time 750
Nota: Después de configurar VAD, ejecute los comandos shut y no shut en el puerto de voz para que los cambios de configuración tengan efecto.
Si continúa observando el siseo y/o la estática, incluso después de ajustar los parámetros mencionados anteriormente en este documento, Cisco recomienda que inhabilite VAD. Esto debe hacerse tanto en las gateways como en los Cisco CallManagers. Estas secciones explican cómo inhabilitar VAD en gateways de Cisco y Cisco CallManager.
En los gateways de Cisco que ejecutan H.323, puede inhabilitar VAD cuando configura el comando no vad bajo los pares de marcado VoIP. Si éste es el gateway de terminación, asegúrese de que no se configure vad en el dial-peer VoIP entrante adecuado que coincida. Puede ser útil configurar números de llamada entrante <números_marcados> para que concuerden con el par de marcado entrante. Para el gateway de origen, no se puede configurar vad en pares de marcado VoIP en función de qué gateways de terminación selectiva requieren desactivar esto.
dial-peer voice 100 voip incoming called-number !--- In order to match all called numbers destination-pattern 1T no vad session target ipv4:10.10.10.10 dtmf-relay h245-alpha ip precedence 5
Asegúrese de que estos parámetros en Cisco CallManager estén establecidos en False (F) para inhabilitar VAD en Cisco CallManager:
Supresión del silencio.
Supresión de silencio para gateways.
Complete estos pasos para encontrar estos parámetros.
Elija Service > Service Parameters en el menú Cisco CallManager Administration.
En el menú desplegable Servidor, elija la dirección o el nombre IP de Cisco CallManager y seleccione Cisco CallManager en el menú desplegable Servicios.
Los parámetros se encuentran en la ventana Service Parameters Configuration.
Establezca los parámetros Supresión de silencio y Supresión de silencio para gateways en False en la ventana de configuración del parámetro de servicio, bajo los parámetros de todo el clúster.
Haga clic en Update para desactivar VAD en Cisco CallManager. Este procedimiento es similar para Cisco CallManager 3.3 y 4.0.