Este documento discute problemas de qualidade de voz, tais como ruído ou sons estáticos, observados durante uma conversa de voz. Este documento também fornece sugestões para ajudá-lo a resolver esses problemas de qualidade de voz.
Os leitores deste documento devem estar cientes destes tópicos:
Uma compreensão básica de Voz sobre IP (VoIP).
Voice Activity Detection (VAD) e seu aplicativo.
As informações neste documento são baseadas nestas versões de software e hardware.
Software Cisco IOS® versão 12.1 e posterior que executa o conjunto de recursos IP Plus.
Todos os Gateways de Voz da Cisco.
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
Consulte as Convenções de Dicas Técnicas da Cisco para obter mais informações sobre convenções de documentos.
A maioria dos sistemas de telefonia baseados em IP inclui um detector de atividade de voz. A finalidade do detector é detectar períodos de silêncio no sinal de voz e transmissão descontínua temporária do sinal durante o período de silêncio. Isso salva a largura de banda e permite que a extremidade oposta ajuste seu buffer de jitter. O lado negativo é que, durante os períodos de silêncio, o telefone na extremidade oposta tem de gerar seu próprio sinal para poder falar com seu ouvinte. Geralmente, o ruído de conforto é reproduzido para o ouvinte para mascarar a ausência de um sinal de áudio da extremidade oposta. O ruído de conforto é normalmente modelado no ruído de extremidade oposta, de modo que não haja um contraste completo ao comutar o ruído de plano de fundo real para o ruído de conforto.
A Figura 1 ilustra um sistema de telefonia IP típico. Os dispositivos de voz de IP mencionados podem ser telefones de IP, gateways analógicos de IP, gateways digitais de IP, etc.
Figura 1: Sistema de telefonia IP
Durante uma chamada entre os dispositivos A e B, o dispositivo A alcança um intervalo de silêncio (Figura 2). O detector de atividade de voz usa um algoritmo para determinar se um intervalo de silêncio foi alcançado. Normalmente, o detector de atividade de voz tem um período de tempo t1 remanescente do período anterior ao final de cada intermitência de fala. Durante esse tempo, ele continua a enviar pacotes para a extremidade oposta. Isso ajuda a evitar comutação excessiva e discurso instável. Se for detectado discurso adicional durante esse intervalo de holdover, o fluxo de voz entre os dispositivos continuará ininterrupto. Depois de decorrer um período de comprimento t1 (T2, na Figura 2), o dispositivo A de voz sobre IP pára de enviar pacotes, caso não haja mais nenhuma detecção de voz.
Figura 2: Eventos VAD do dispositivo A
No tempo T1 (Figura 2), é enviada uma indicação ao dispositivo B para alertá-lo sobre o início do tempo remanescente do período anterior do VAD. Essa indicação também contém a tempo restante da VAD. Quando esta mensagem for recebida, o dispositivo B começa a atenuar diminuindo o sinal de voz que recebe do dispositivo A e o mescla com o ruído de conforto gerado que deve atenuar aumentando (conforme mostrado na Figura 3).
Figura 3: Ruído de fundo vs. atenuação de ruído de conforto durante o período de holdover
Essa atenuação proporciona uma transição tranquila entre o ruído de fundo real e o ruído de conforto gerado. Ela torna mais suaves e muito menos perceptíveis as transições de ambientes em que as características do ruído de fundo são muito diferentes das do ruído de conforto gerado. O intervalo restante da VAD (t1) determina quão eficiente é a técnica. Intervalos mais longos resultam em transições sonoras mais suaves.
Se o sinal de voz é cortado antes do T2 (Figura 2), a atenuação é imediatamente encerrada, e o áudio de recebimento de escala completa é reproduzido. Esse corte deve ser assinalado através de outra indicação do dispositivo A ao dispositivo B. Como o sinal de voz é significativamente mais alto do que o ruído de fundo, ele encobre a transição e torna-se imperceptível.
A sinalização mencionada anteriormente pode ser na banda (por exemplo, por meio de um novo tipo de payload no RTP ou um evento de sinalização nomeado) ou fora de banda (por exemplo, um evento de sinalização H.245).
O único motivo para ouvir um som sibilante ou estático durante uma chamada de voz é a introdução de um ruído aceitável em uma conversação. Existem duas possibilidades nas quais é injetado ruído de conforto em uma chamada de voz. O mais importante é o uso do VAD. Sempre que o VAD é usado, os pacotes de ruído aceitável são apresentados no fluxo de áudio. A segunda possibilidade (não é um contribuinte principal) é kicking-in de echo-cancellation. Sempre que o cancelamento de eco se torna ativo, pacotes de ruído de conforto são introduzidos no fluxo de áudio. As características desses pacotes de conforto são determinadas por meio de um algoritmo que inclui o monitoramento da fala em andamento e o recebimento de uma assinatura do ruído de fundo. Esse ruído de conforto é o chiado.
Nesse cenário, se o dispositivo A pausar, o dispositivo B pode experimentar algum chiado. Isso pode ser feito por um ajuste adequado dos parâmetros VAD. A Cisco recomenda que você desative o VAD se o ajuste fino desses parâmetros não resolver o problema.
Existem dois parâmetros que controlam a funcionalidade VAD:
Um limiar inicial é decidido para governar quando o VAD torna-se ativo. Isso é controlado quando você define o comando music-threshold <threshold_value> em uma porta de voz. O intervalo para isso é de -70 dBm a -30 dBm. O valor padrão é -38 dBm. Se você configurar um valor mais baixo (em direção a -70 dBm), o VAD se tornará ativo com uma intensidade de sinal muito mais baixa. O volume deve realmente abaixar muito para que seja considerado como silêncio. Se você configurar um valor mais alto (mais próximo de -30 dBm), o VAD se tornará ativo mesmo para uma pequena queda de intensidade do sinal de voz. Isso faz com que o playout reproduza pacotes de ruído de conforto com mais frequência. No entanto, isso pode levar a um pequeno recorte de áudio.
3640-6#configure terminal Enter configuration commands, one per line. End with CNTL/Z. 3640-6(config)#voice-port 3/0/0 3640-6(config-voiceport)#music-threshold ? !--- WORD: Enter a number between -70 to -30. 3640-6(config-voiceport)#music-threshold -50 3640-6(config-voiceport)#end 3640-6# 3640-6#show run | begin voice-port voice-port 3/0/0 music-threshold -50
Quando o VAD se tornar ativo, você poderá controlar o componente de ruído de fundo e ruído de conforto quando configurar o comando voice vad-time <timer_value> na configuração global. Esse é o tempo de retardo em milésimos de segundo para detecção de silêncio e supressão da transmissão do pacote de voz. O valor padrão do tempo remanescente do período anterior é de 250 ms. Isso significa que dentro de 250 ms, o ruído de conforto chega completamente. O intervalo deste cronômetro é de 250 ms a 65,536 ms. Se um valor alto for configurado, o ruído de conforto aparecerá bem depois (o ruído de fundo continua a ser executado). Se for configurado para 65.536 ms, o ruído de conforto será desativado. Um valor maior para esse timer é desejado para realização de uma transição mais tranqüila entre o ruído de plano de fundo e o ruído de conforto. A desvantagem de uma configuração de tempo de vad alto não está totalmente alcançando a economia de largura de banda desejada de 30% a 35%.
3640-6#configure terminal Enter configuration commands, one per line. End with CNTL/Z. 3640-6(config)#voice vad-time ? <250-65536>milliseconds 3640-6(config)#voice vad-time 750 3640-6(config)#end 3640-6# 3640-6# 3640-6# 3640-6#show run | begin vad-time voice vad-time 750
Observação: depois de configurar o VAD, emita os comandos shut e no shut na porta de voz para que as alterações de configuração tenham efeito.
Se você continuar observando o chiado e/ou estático, mesmo depois de ajustar os parâmetros mencionados anteriormente neste documento, a Cisco recomenda que você desative o VAD. Isso precisa ser feito nos gateways e também nos Cisco CallManagers. Estas seções explicam como desativar o VAD em gateways Cisco e Cisco CallManager.
Nos gateways Cisco que executam o H.323, você pode desativar o VAD quando configurar o comando no vad nos peers de discagem VoIP. Se este for o gateway de terminação, verifique se nenhum vad está configurado no correspondente de discagem VoIP de entrada correspondente. Talvez seja útil configurar o número de entrada chamado <número_discado> de forma a correspondê-lo ao correspondente de discagem de entrada apropriado. Para o gateway de origem, nenhum vad pode ser configurado em correspondentes de discagem VoIP com base nos quais os gateways de terminação seletiva exigem para desligá-lo.
dial-peer voice 100 voip incoming called-number !--- In order to match all called numbers destination-pattern 1T no vad session target ipv4:10.10.10.10 dtmf-relay h245-alpha ip precedence 5
Certifique-se de que estes parâmetros no Cisco CallManager estejam definidos como Falso (F) para desativar o VAD no Cisco CallManager:
Supressão de silêncio.
Supressão de silêncio para gateways.
Conclua estes passos para localizar esses parâmetros.
Escolha Service > Service Parameters no menu Cisco CallManager Administration.
No menu suspenso Server (Servidor), escolha o endereço IP ou o nome do Cisco CallManager e selecione Cisco CallManager no menu suspenso Services (Serviços).
Os parâmetros estão localizados na janela Service Parameters Configuration.
Defina os parâmetros Silence Suppression and Silence Suppression for Gateways como False na janela de configuração Service Parameter (Parâmetro de serviço), nos parâmetros de nível de cluster.
Clique em Update para desativar o VAD no Cisco CallManager. Este procedimento é semelhante para o Cisco CallManager 3.3 e 4.0.