Este documento ajuda a resolver defeitos de um sistema que não responde. O documento também discute a causa e como você pode eliminar o problema.
Um roteador parece parar de funcionar quando o sistema não responde ao console ou a consultas enviadas da rede (por exemplo, Telnet, SNMP, etc.). Esses problemas podem ser classificados em duas grandes categorias:
Quando o console não responde.
Quando o tráfego não passa.
Não existem requisitos específicos para este documento.
As informações neste documento são baseadas nestas versões de software e hardware:
Todas as versões de software Cisco IOS®
Todos os Cisco Routers
Este documento não se aplica aos Cisco Catalyst Switches nem a plataformas MGX.
As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se a sua rede estiver ativa, certifique-se de que entende o impacto potencial de qualquer comando.
Para obter mais informações sobre convenções de documento, consulte as Convenções de dicas técnicas Cisco.
Problemas de console ocorrem quando o roteador não responde à entrada na porta do console. Se o console não estiver respondendo, significa que um processo de prioridade alta impede que o driver do console responda à entrada.
Verifique a conectividade do cabo.
Verifique se a fonte de alimentação está ligada.
Verifique o status do LED do roteador. Se todos os LEDs estão desligados, o mais provável é que o problema esteja no fornecimento de energia do roteador.
Se o tráfego ainda fluir pelo roteador:
Desconecte as interfaces de rede e veja se o roteador responde. Muitas vezes, o roteador supõe que está fazendo algo muito importante para as sessões exec de serviço.
Você também pode tentar reproduzir o problema depois de emitir estes comandos:
Nas séries Cisco 7200 e 7500:
configure terminal scheduler allocate 3000 1000 ^Z
O comando scheduler allocate garante tempo de CPU para processos de baixa prioridade. Ele coloca um tempo máximo alocado para switching rápida (3000 microssegundos - usec) e switching de processo (1000 usec) por contexto de interrupção de rede.
Em todas as outras plataformas, use:
configure terminal scheduler interval 500 ^Z
O comando scheduler interval permite que processos de baixa prioridade sejam agendados a cada 500 usec e, portanto, permite que alguns comandos sejam digitados mesmo se o uso da CPU estiver em 100%.
Verifique os Comandos Básicos de Gerenciamento do Sistema na Referência de Comandos do Cisco IOS Software para obter mais informações sobre esses comandos.
Se o console não responder porque a utilização da CPU do roteador está alta, é importante encontrar e corrigir a causa da alta utilização da CPU. Por exemplo, se o tráfego IP comutado por processo causar problemas, isso será refletido no processo "IP Input" na saída do comando show processes cpu. Nessa situação, é importante coletar o resultado dos comandos show interfaces, show interfaces stat e possivelmente show processes para diagnosticar o problema. Para corrigir o problema, você precisaria reduzir a quantidade de tráfego IP que é comutado por processo. Consulte Troubleshooting de Alta Utilização da CPU em Cisco Routers para obter mais informações.
Outra causa possível de um travamento aparente é a falha de alocação de memória, ou seja, o roteador usou toda a memória disponível ou a memória foi fragmentada em pedaços tão pequenos que o roteador não consegue encontrar um bloco disponível utilizável. Para obter mais informações, consulte Troubleshooting de Problemas de Memória.
O roteador pode parar de responder devido a um problema relacionado à segurança, como um worm ou vírus. Essa é a causa mais provável se não houve alterações recentes na rede, como uma atualização do IOS do roteador. Normalmente, uma alteração na configuração, como a adição de linhas às listas de acesso, pode minimizar os efeitos desse problema. A página de Avisos e diretrizes de segurança da Cisco contêm informações sobre a detecção das causas mais prováveis e as alternativas específicas.
Para obter informações adicionais, consulte:
Se o roteador parecer congelar durante o processo de inicialização, pode ser o resultado de um recurso configurado incorretamente ou de um defeito de software em um recurso configurado. Isso é geralmente evidente pela aparência de um aviso ou mensagem de erro no console imediatamente antes do congelamento do roteador.
Como solução alternativa para esse problema, inicialize o roteador no ROMMON, ignore a configuração armazenada e configure-a novamente. Conclua estes passos:
Conecte um terminal ou PC com emulação de terminal à porta de console do roteador.
Utilize estas configurações de terminal:
taxa de baud 9600
Sem paridade
8 bits de dados
1 bit de parada
Nenhum controle de fluxo
Reinicialize o roteador e entre no ROMMON pressionando break no teclado do terminal dentro de 60 segundos da inicialização. Se a sequência de ruptura não funcionar, veja as Combinações de sequência chave de ruptura padrão durante a recuperação de senha para outras combinações chave.
Altere o registro de configuração para 0x2142 e reinicie o roteador. Para isso, execute o comando confreg 0x2142 no prompt rommon 1>. Em seguida, digite reset no prompt rommon 2>. Isso faz com que o roteador seja inicializado a partir da Flash sem carregar a configuração.
Digite no depois de cada pergunta da configuração ou pressione Ctrl-C para pular o procedimento inicial de configuração.
Digite enable no prompt Router>.
Você está no modo enable e vê o prompt Router#.
Agora, você pode salvar uma configuração vazia (todos os comandos removidos). Emita o comando copy running-config startup-config. Como alternativa, se você suspeitar que um determinado comando causa o problema, poderá editar a configuração. Para fazer isso, emita o comando copy startup-config running-config. Em seguida, digite configure terminal e faça as alterações.
Ao terminar, altere o registro de configuração de volta para 0x2102. Para isso, digite config-register 0x2102. Emita o comando copy running-config startup-config para confirmar as alterações.
Se o tráfego não fluir pelo roteador:
Se o tráfego não passar mais pelo roteador e o console não responder, provavelmente há um problema com o sistema. Geralmente, isso significa que o roteador está preso em um loop contínuo ou preso em uma função. Isso é quase sempre causado por um bug no software. Instale a versão de manutenção mais recente do treinamento do software Cisco IOS que você está executando no momento.
Antes de criar uma solicitação de serviço com o Cisco TAC, obtenha um rastreamento de pilha do ROM Monitor. A obtenção de rastreamentos de pilha durante um problema possibilita determinar em que parte do código o roteador está em loop ou travado.
Problemas de tráfego ocorrem quando o console permanece responsivo, mas o tráfego não passa pelo roteador. Nesse caso, parte do tráfego ou parte das interfaces não responde. Este comportamento pode ser provocado por muitas causas diferentes. Quando esse problema ocorre, podem ser coletadas informações do roteador através da porta do console. As causas desses problemas de tráfego podem variar de erros nas interfaces a problemas de software e hardware.
Problema de roteamento - Alterações na topologia da rede ou na configuração de alguns roteadores podem ter afetado as tabelas de roteamento.
Alta utilização da CPU - Emita o comando show process cpu. Se a CPU estiver acima de 95%, o desempenho do roteador pode ser afetado e os pacotes podem ser atrasados ou descartados. Consulte Troubleshooting de Alta Utilização da CPU em Roteadores para obter mais informações.
Interface inativa - Uma das interfaces do roteador pode estar inativa. Há vários eventos que podem causar isso, que podem variar de um comando de configuração errado a uma falha de hardware da interface ou do cabo. Se algumas interfaces aparecerem inativas quando você emitir um comando show interfaces, tente descobrir o que causou isso.
Interfaces divididas - Este é um caso particular de vazamentos de buffer que faz com que a fila de entrada de uma interface seja preenchida até o ponto em que não possa mais aceitar pacotes. Recarregue o roteador. Isso libera essa fila de entrada e restaura o tráfego até que a fila esteja cheia novamente. Isso pode levar de alguns segundos a algumas semanas, com base na gravidade do vazamento.
A forma mais fácil de se identificar uma interface dividida é emitir um comando show interfaces e procurar por algo que se pareça com isto:
Output queue 0/40, 0 drops; input queue 76/75, 27 drops
Consulte Troubleshooting de Vazamentos de Buffer para obter diretrizes detalhadas e exemplos.
K-trace refere-se ao procedimento usado para obter um rastreamento de pilha do roteador do monitor de ROM. Nos roteadores com código ROM Monitor mais antigo, um rastreamento de pilha é obtido com o comando k. Nos roteadores que executam o código mais recente do ROM Monitor, o comando stack também pode ser usado.
Conclua estes passos para obter rastreamentos de pilha de um roteador que não responde:
Ative a sequência de interrupção. Para isso, altere o valor do registro de configuração. O valor do oitavo bit deve ser definido como zero para que a quebra não seja ignorada. Um valor de 0x2002 funciona.
Router#configure terminal Enter configuration commands, one per line. End with CNTL/Z. Router(config)#config-register 0x2002
Recarregue o roteador de forma que o valor de registro de nova configuração seja usado.
Enviar a sequência de interrupção quando o problema ocorrer. O prompt do Monitor de ROM ">" ou "rommon 1 >" deve ser exibido.
Capturar um rastreamento de pilha. Para isso, colete a saída dos comandos k 50 ou stack 50. Adicione 50 ao comando para imprimir um rastreamento de pilha mais longo.
Emita o comando c ou count para continuar.
Repita os três últimos passos diversas vezes para garantir que diversos pontos em um loop contínuo foram capturados.
Depois de obter vários rastreamentos de pilha, reinicialize o roteador para se recuperar do estado suspenso.
Aqui está um exemplo deste procedimento:
User break detected at location 0x80af570 rommon 1 > k 50 Stack trace: PC = 0x080af570 Frame 00: FP = 0x02004750 RA = 0x0813d1b4 Frame 01: FP = 0x02004810 RA = 0x0813a8b8 Frame 02: FP = 0x0200482c RA = 0x08032000 Frame 03: FP = 0x0200483c RA = 0x040005b0 Frame 04: FP = 0x02004b34 RA = 0x0401517a Frame 05: FP = 0x02004bf0 RA = 0x04014d9c Frame 06: FP = 0x02004c00 RA = 0x040023d0 Frame 07: FP = 0x02004c68 RA = 0x04002e9e Frame 08: FP = 0x02004c78 RA = 0x040154fe Frame 09: FP = 0x02004e68 RA = 0x04001fc0 Frame 10: FP = 0x02004f90 RA = 0x0400c41e Frame 11: FP = 0x02004fa4 RA = 0x04000458 Suspect bogus FP = 0x00000000, aborting rommon 2 > cont
Repita esse procedimento várias vezes no caso de um problema do sistema para coletar várias instâncias do rastreamento de pilha.
Quando um roteador não responde, é quase sempre um problema de software. Nesse caso, colete o máximo de informações possível, incluindo o rastreamento de pilha, antes de abrir uma solicitação de serviço do TAC. É importante também incluir as saída dos comandos show version, show run e show interfaces.
Se você abrir uma Solicitação de Serviço do TAC, anexe as seguintes informações à sua solicitação para solucionar problemas de suspensão do roteador: |
Observação: se o console estiver respondendo, não recarregue nem ligue e desligue manualmente o roteador antes de coletar as informações acima, a menos que seja necessário solucionar problemas de suspensão do roteador, pois isso pode causar a perda de informações importantes necessárias para determinar a causa raiz do problema. |
Revisão | Data de publicação | Comentários |
---|---|---|
1.0 |
02-Aug-2006 |
Versão inicial |