부산서 시작된 KT 통신장애…데이터 안전장치 없어 전국으로 확산

입력 : 2021-10-29 15:00:00 수정 : 2021-10-29 15:08:53
페이스북 페이스북 카카오

KT 인터넷망이 25일 오전 11시 20분께부터 전국 곳곳에서 중단·지연 등 장애가 발생했다. 사진은 이날 인터넷 연결이 끊어진 KT 모바일과 PC 화면. 연합뉴스 KT 인터넷망이 25일 오전 11시 20분께부터 전국 곳곳에서 중단·지연 등 장애가 발생했다. 사진은 이날 인터넷 연결이 끊어진 KT 모바일과 PC 화면. 연합뉴스

25일 발생한 KT의 통신장애 원인은 장비 설정 과정에서 작업자가 ‘exit’ 명령어 입력하지 않았기 때문이라는 분석이 나왔다. KT는 잘못된 데이터 전달에 대한 안전장치가 없어 부산에서 발생한 데이터 오류가 전국으로 확산됐다.

과학기술정보통신부는 29일 발표한 ‘KT 네트워크 장애 원인 분석 결과’에서 “(KT) 부산국사에서 기업 망 라우터 교체 작업 중, 작업자가 잘못된 설정 명령을 입력했고, 이후 라우팅(네트워크 경로 설정) 오류로 인해 전국적인 인터넷 네트워크 장애가 발생한 것”이라고 밝혔다.

과학기술정보통신부는 29일 발표한 ‘KT 네트워크 장애 원인 분석 결과’를 통해 “(KT) 부산국사에서 기업 망 라우터 교체 작업 중, 작업자가 잘못된 설정 명령을 입력했고, 이후 라우팅(네트워크 경로 설정) 오류로 인해 전국적인 인터넷 네트워크 장애가 발생한 것”이라고 발혔다. 자료:과기정통부 과학기술정보통신부는 29일 발표한 ‘KT 네트워크 장애 원인 분석 결과’를 통해 “(KT) 부산국사에서 기업 망 라우터 교체 작업 중, 작업자가 잘못된 설정 명령을 입력했고, 이후 라우팅(네트워크 경로 설정) 오류로 인해 전국적인 인터넷 네트워크 장애가 발생한 것”이라고 발혔다. 자료:과기정통부

작업자가 사고발생 라우터에 설정명령어를 입력하는 과정에서 마지막에 ‘exit’ 명령어를 누락했고 이 때문에 외부와 연결된 대용량 프로토콜(BGP 프로토콜) 정보가 KT 내부망에 이용되는 소용량 프로토콜(IS-IS 프로토콜)로 쏟아져 오류가 발생했다.

이렇게 부산에서 잘못된 라우팅 경로가 설정된 이후, 다른 지역의 IS-IS 라우터 등에도 잘못된 업데이트 정보가 전달됐다. KT 네트워크 내에 있는 라우터들을 연결하는 IS-IS 프로토콜은 잘못된 데이터 전달에 대한 안전장치 없이 전국을 모두 하나로 연결하고 있어 전국의 라우터에 연쇄적인 장애가 발생했다는 게 과기정통부의 설명이다.

인터넷 서비스망과 별도의 망으로 구성된 KT의 IPTV 서비스와 음성전화서비스에서도 25일 일부 장애가 발생한 데 대해선 “인터넷 서비스 장애로 인해 전화와 문자 이용이 늘었고, 단말전원을 다시 켜는 이용자로 인한 트래픽 증가가 발생해 부하가 가중됐다”는 분석이 나왔다.

25일 발생한 KT의 통신장애 원인은 장비 설정 과정에서 작업자가 ‘exit’ 명령어 입력하지 않았기 때문이라는 분석이 나왔다. KT는 잘못된 데이터 전달에 대한 안전장치가 없어 부산에서 발생한 데이터 오류가 전국으로 확산됐다. 사진은 KT네트워크 구조. 자료:과기정통부 25일 발생한 KT의 통신장애 원인은 장비 설정 과정에서 작업자가 ‘exit’ 명령어 입력하지 않았기 때문이라는 분석이 나왔다. KT는 잘못된 데이터 전달에 대한 안전장치가 없어 부산에서 발생한 데이터 오류가 전국으로 확산됐다. 사진은 KT네트워크 구조. 자료:과기정통부

과기정통부는 이번 통신장애와 관련해 KT의 관리적·기술적 문제점이 있었다고 지적했다. 당초 KT 네트워크관제센터가 야간작업(01시~06시)을 승인했지만 작업이 주간에 수행되는 과정에서 장애가 발생했다. 또 작업 관리자 없이 KT 협력업체 직원들인 작업자들끼리만 라우팅 작업을 수행하는 등 작업오류를 방지하기 위한 작업관리체계가 부실했다. 특히 네트워크가 연결된 채로 작업이 이뤄져 오류가 곧바로 확산됐고 사전검증 단계에서도 오류를 파악하지 못했다. 네트워크가 차단된 가상 상태에서 오류 여부를 사전에 발견하기 위한 가상 ‘테스트베드’도 없었고, 지역에서 발생한 오류가 전국으로 확산하는 것을 차단할 수 있는 시스템도 없어서 전국적인 통신장애가 발생했다.

과기정통부는 이와 관련 ‘네트워크 안정성 확보방안’을 마련하겠다고 밝혔다. 우선 단기 대책으로 주요통신사업자의 네트워크 작업체계, 기술적 오류확산 방지체계 등 네트워크 관리체계를 점검하고, 사업자가 네트워크 작업으로 인한 오류여부를 사전에 진단할 수 있는 시뮬레이션 시스템을 도입할 예정이다.

또 승인된 작업계획서의 내용이나 절차가 준수되는지에 대해 네트워크관제센터에서 기술적 점검 체계를 구축토록 하고, 라우팅 설정오류로 인한 피해를 최소화하기 위해, 주요통신사업자가 라우팅 작업을 할 때 한 번에 업데이트되는 경로정보 개수를 일정 수준 이하로 제한 등이 검토될 계획이다. 정부는 이번 장애에 따른 보상과 관련해선 “KT는 이용자 피해현황 조사 및 피해구제 방안 마련을 추진하고, 방송통신위원회는 이용자 피해구제 방안 이행여부를 점검할 예정”이라고 밝혔다.

김종우 기자 kjongwoo@busan.com

당신을 위한 뉴스레터