ePub(85.7 KB) iPhone, iPad, Android, Sony Reader 또는 Windows Phone의 다양한 앱에서 보기
Mobi (Kindle)(80.9 KB) Kindle 디바이스에서 보기 또는 다양한 디바이스의 Kindle 앱에서 보기
업데이트:2007년 4월 23일
문서 ID:12770
편견 없는 언어
본 제품에 대한 문서 세트는 편견 없는 언어를 사용하기 위해 노력합니다. 본 설명서 세트의 목적상, 편견 없는 언어는 나이, 장애, 성별, 인종 정체성, 민족 정체성, 성적 지향성, 사회 경제적 지위 및 교차성에 기초한 차별을 의미하지 않는 언어로 정의됩니다. 제품 소프트웨어의 사용자 인터페이스에서 하드코딩된 언어, RFP 설명서에 기초한 언어 또는 참조된 서드파티 제품에서 사용하는 언어로 인해 설명서에 예외가 있을 수 있습니다. 시스코에서 어떤 방식으로 포용적인 언어를 사용하고 있는지 자세히 알아보세요.
이 번역에 관하여
Cisco는 전 세계 사용자에게 다양한 언어로 지원 콘텐츠를 제공하기 위해 기계 번역 기술과 수작업 번역을 병행하여 이 문서를 번역했습니다. 아무리 품질이 높은 기계 번역이라도 전문 번역가의 번역 결과물만큼 정확하지는 않습니다. Cisco Systems, Inc.는 이 같은 번역에 대해 어떠한 책임도 지지 않으며 항상 원본 영문 문서(링크 제공됨)를 참조할 것을 권장합니다.
참고: 라인 카드 충돌의 95%가 넘는 경우 캐시 패리티 예외(SIG=20), 버스 오류 예외(SIG=10) 및 소프트웨어 강제 충돌(SIG=23)이 적용됩니다.
diag exec 명령
Cisco 12000 Series는 다른 보드 구성 요소를 테스트하기 위해 diag [slot#] 명령을 지원합니다. 이 명령은 하드웨어 관련 충돌을 해결하고 잘못된 보드를 식별하는 데 유용합니다.
verbose 옵션을 사용하면 라우터가 수행 중인 테스트 목록을 표시합니다. 그렇지 않으면 "PASSED" 또는 "FAILURE" 메시지만 표시합니다.
참고: 이 진단을 수행하면 테스트 기간(일반적으로 약 5분) 동안 라인 카드의 모든 활동이 중지됩니다.
Cisco IOS Software Release 12.0(22)S부터 Cisco는 Cisco IOS 소프트웨어 이미지에서 Cisco 12000 Series Internet Router 필드 진단 라인 카드 이미지의 번들을 해제했습니다. 이전 버전에서는 명령줄에서 진단을 실행할 수 있으며 임베디드 이미지가 실행됩니다. 20MB 플래시 메모리 카드를 사용하는 고객을 수용하기 위해 라인 카드 필드 진단은 이제 별도의 이미지로 저장되고 유지되며, 이 이미지는 필드 진단 명령을 사용하기 전에 플래시 메모리 카드 또는 TFTP(Trivial File Transfer Protocol) 부팅 서버에서 사용할 수 있어야 합니다. 라우터 프로세서 및 스위치 패브릭 필드 진단은 계속 번들로 제공되며 별도의 이미지에서 시작할 필요가 없습니다. Cisco 12000 Series Internet Router의 Field Diagnostics에서 자세한 내용을 확인할 수 있습니다.
다음은 diag [slot#] 명령 출력의 예입니다.
Router#diag 3 verbose
Running DIAG config check
Running Diags will halt ALL activity on the requested slot.
[confirm]
CR1.LND10#
Launching a Field Diagnostic for slot 3
Downloading diagnostic tests to slot 3 (timeout set to 400 sec.)
Field Diag download COMPLETE for slot 3
FD 3> *****************************************************
FD 3> GSR Field Diagnostics V3.0
FD 3> Compiled by award on Tue Aug 3 15:58:13 PDT 1999
FD 3> view: award-bfr_112.FieldDiagRelease
FD 3> *****************************************************
FD 3> BFR_CARD_TYPE_OC48_1P_POS testing...
FD 3> running in slot 3 (128 tests)
Executing all diagnostic tests in slot 3
(total/indiv. timeout set to 600/200 sec.)
FD 3> Verbosity now (0x00000001) TESTSDISP
FDIAG_STAT_IN_PROGRESS: test #1 R5K Internal Cache
FDIAG_STAT_IN_PROGRESS: test #2 Burst Operations
FDIAG_STAT_IN_PROGRESS: test #3 Subblock Ordering
FDIAG_STAT_IN_PROGRESS: test #4 Dram Marching Pattern
FDIAG_STAT_DONE_FAIL test_num 4, error_code 6
Field Diagnostic: ****TEST FAILURE**** slot 3: last test run 4,
Dram Marching Pattern, error 6
Field Diag eeprom values: run 2 fail mode 1 (TEST FAILURE) slot 3
last test failed was 4, error code 6
Shutting down diags in slot 3
slot 3 done, will not reload automatically
발생한 오류에 따라 슬롯이 자동으로 다시 로드되거나 로드되지 않을 수 있습니다. 그렇지 않으면 수동으로 다시 로드될 때까지 상태가 고정되거나 일치하지 않을 수 있습니다(show diag [slot #] 명령으로 확인). 정상입니다. 카드를 수동으로 다시 로드하려면 hw-module slot [slot#] reload 명령을 사용합니다.
캐시 패리티 예외
SIG =20을 사용하여 show context [slot #] 출력에서 캐시 패리티 예외를 식별할 수 있습니다.
Cisco 디바이스에서 show tech-support(enable mode에서) 명령 출력이 있는 경우 잠재적인 문제 및 수정 사항을 표시합니다. 사용하기 위해 등록된 고객이고 로그인되어 있으며 JavaScript를 활성화해야 합니다.
두 가지 다른 종류의 패리티 오류가 있습니다.
소프트 패리티 오류 - 칩 내의 에너지 수준(예: 1 또는 0)이 변경될 때 발생합니다. 소프트 패리티 오류가 발생할 경우 보드나 구성 요소를 교체할 필요가 없습니다.
하드 패리티 오류 - 데이터가 손상되는 칩 또는 보드 오류가 있을 때 발생합니다. 이 경우 영향을 받는 구성 요소(일반적으로 메모리 칩 스왑 또는 보드 교체)를 다시 장착하거나 교체해야 합니다. 동일한 주소에 여러 패리티 오류가 있는 경우 하드 패리티 오류가 발생합니다. 식별하기 어려운 더 복잡한 경우가 있지만 일반적으로 특정 메모리 영역에서 비교적 짧은 시간(몇 주 ~ 몇 개월)에 둘 이상의 패리티 오류가 발견되면 하드 패리티 오류로 간주됩니다.
연구 결과에 따르면 소프트 패리티 오류는 하드 패리티 오류보다 10~100배 더 자주 발생합니다.
이러한 오류를 해결하려면 해당 슬롯에 대한 diag 명령을 실행할 유지 보수 창을 찾습니다.
진단 결과 오류가 발생하면 라인 카드를 교체합니다.
오류가 없는 경우 소프트 패리티 오류가 발생할 수 있으며 라인 카드를 교체할 필요가 없습니다(짧은 시간 후에 패리티 오류가 있는 두 번째 충돌이 발생한 경우 제외).
버스 오류 예외
SIG=10을 사용하여 show context [slot #] 출력에서 버스 오류 예외를 식별할 수 있습니다.
Cisco 디바이스에서 show tech-support(enable mode에서) 명령 출력이 있는 경우 잠재적인 문제 및 수정 사항을 표시합니다. 사용하기 위해 등록된 고객이고 로그인되어 있으며 JavaScript를 활성화해야 합니다.
이러한 유형의 크래시는 일반적으로 소프트웨어와 관련되지만, 어떤 이유(예: 완전히 새로운 카드이거나 정전 후 발생한 충돌)로 인해 하드웨어 관련 문제가 될 수 있다고 생각되면 해당 슬롯에 대해 diag 명령을 실행합니다.
참고: 일부 소프트웨어 버그로 인해 diag 명령이 오류를 보고하도록 하는 것으로 알려져 있지만 하드웨어에 문제가 없습니다. 카드를 이미 교체한 적이 있지만 진단 프로그램에서 동일한 테스트에서 여전히 실패하면 이 문제가 영향을 받을 수 있습니다. 이 경우, 충돌을 소프트웨어 문제로 간주합니다.
Cisco IOS 소프트웨어 릴리스 트레인의 최신 버전으로 업그레이드하면 라인 카드 버스 오류를 일으키는 모든 고정 버그가 제거됩니다. 업그레이드 후에도 충돌이 계속 발생하면 관련 정보(Gather Information about the Crash)와 show tech-support를 참조하십시오. 또한 유용하다고 생각되는 정보(예: 최근 토폴로지 변경 또는 최근에 구현된 새로운 기능)를 수집하여 Cisco 지원 담당자에게 문의하십시오.
소프트웨어 강제 충돌
show context [slot #] 출력에서 SIG=23에 의해 소프트웨어에 의한 충돌을 식별할 수 있습니다. 이름에도 불구하고 이러한 충돌이 항상 소프트웨어와 관련된 것은 아닙니다.
Cisco 디바이스에서 show tech-support(enable mode에서) 명령 출력이 있는 경우 잠재적인 문제 및 수정 사항을 표시합니다. 사용하기 위해 등록된 고객이고 로그인되어 있으며 JavaScript를 활성화해야 합니다.
소프트웨어 강제 충돌의 가장 일반적인 원인은 "Fabric Ping Timeout"입니다. 정상적인 라우터 작업 중에 RP(Route Processor)는 라인 카드를 계속 ping합니다. 라인 카드가 응답하지 않으면 경로 프로세서가 이를 재설정합니다. 이로 인해 영향을 받는 라인 카드의 소프트웨어 강제 충돌(SIG=23)이 발생하고 라우터의 로그에 다음 오류가 표시됩니다.
Mar 12 00:42:48: %GRP-3-FABRIC_UNI:
Unicast send timed out (4)
Mar 12 00:42:50: %GRP-3-COREDUMP: Core dump incident on slot 4, error: Fabric ping failure
패브릭 핑 시간 제한을 해결하려면 라인 카드가 ping에 응답하지 않은 이유를 확인해야 합니다. 다음과 같은 여러 가지 원인이 있을 수 있습니다.
라인 카드에 높은 CPU 사용률이 발생하고 있습니다. - execute-on slot [slot #] show proc cpu 명령을 사용하여 확인할 수 있습니다. CPU가 매우 높은 경우(95% 이상) Cisco 라우터에서 CPU 사용률 문제 해결 을 참조하십시오.
IPC(Inter Process Communication)에 소프트웨어 버그가 있거나 라인 카드에 IPC 버퍼가 부족합니다. 이러한 소프트웨어 강제 재로드는 대부분 소프트웨어 버그로 인해 발생합니다.
Cisco IOS 소프트웨어 릴리스 트레인의 최신 버전으로 업그레이드하면 패브릭 핑 시간 초과를 일으키는 모든 고정 버그가 제거됩니다. 업그레이드 후에도 충돌이 계속 발생하면 관련 정보(Getting Information about the Crash)와 show tech-support, show ipc status 및 유용하다고 생각하는 정보(예: 최근 토폴로지 변경 또는 최근에 구현된 새 기능)를 수집하여 Cisco 지원 담당자에게 문의하십시오.
하드웨어 장애 - 카드가 오랫동안 정상적으로 작동했지만 최근 토폴로지, 소프트웨어 또는 기능 변경이 발생하지 않았거나 이동 또는 정전 후에 문제가 시작된 경우 하드웨어 결함이 발생할 수 있습니다. 영향 받는 라인 카드에서 diag 명령을 실행합니다. 결함이 있는 경우 라인 카드를 교체합니다. 라인 카드가 여러 개 영향을 받거나 디스크가 정상 상태인 경우 패브릭을 교체합니다.
%GSRSPA-6-ERRORRECOVER: 하위 슬롯 0에서 하드웨어 또는 소프트웨어 오류가 발생했습니다.원인: TXECCERR 자동 오류 복구 시작
TXECCERR/RXECCERR 오류는 RxFIFO 또는 TxFIFO 복구 불가능한 ECC 오류 인터럽트가 시간 간격 내의 임계값 값보다 많이 MAC에서 발생할 때 발생합니다. 복구할 수 없는 ECC 오류는 ECC 논리로 해결할 수 없습니다. RxFIFO 읽기 중에 복구할 수 없는 오류가 발생하면 데이터가 속한 패킷이 SPI4 수신 인터페이스에서 EOP/Abort로 표시되고 상위 레이어에서 삭제됩니다.
이는 하드웨어 때문이며 SIP/SPA를 다시 로드하면 수정됩니다. 영구 솔루션은 오류를 방지하기 위해 SIP/SPA를 교체하는 것입니다.
기타 충돌
다른 충돌 유형은 위에서 언급한 두 가지 것보다 훨씬 덜 일반적입니다. 대부분의 경우 diag 명령은 카드를 교체해야 하는지 여부를 나타내야 합니다. 카드가 진단 테스트를 올바르게 통과하면 소프트웨어를 업그레이드하는 것이 좋습니다.
TAC 서비스 요청을 열 경우 수집할 정보
위의 트러블슈팅 단계를 거친 후에도 지원이 필요한 경우 Cisco TAC에 서비스 요청(등록된 고객만 해당)을 열려면 다음 정보를 포함해야 합니다.
서비스 요청을 열기 전에 수행된 트러블슈팅.
show technical-support 출력(가능한 경우 활성화 모드)
로그 출력 또는 콘솔 캡처 표시(사용 가능한 경우)
실행 슬롯 [slot #]은 라인 카드 충돌이 발생한 슬롯에 대한 기술을 표시합니다.
수집된 데이터를 압축되지 않은 일반 텍스트 형식(.txt)으로 서비스 요청에 첨부합니다. TAC 서비스 요청 툴을 사용하여 업로드하여 서비스 요청에 정보를 첨부할 수 있습니다(등록된 고객만 해당). Service Request 툴에 액세스할 수 없는 경우, 이메일 첨부 파일의 정보를 attach@cisco.com으로 보낼 수 있습니다. 이때 서비스 요청 번호는 메시지의 제목 줄에 표시됩니다.
참고: Cisco 12000 Series Internet Router에서 라인 카드 충돌 문제를 해결하는 데 필요하지 않은 경우, 문제의 근본 원인을 파악하는 데 필요한 중요한 정보가 손실될 수 있으므로 위의 정보를 수집하기 전에 라우터를 수동으로 다시 로드하거나 전원을 껐다가 다시 켜지 마십시오.