[뉴스토마토 배덕훈 기자] 지난 주말 시내·고속버스 통합 예매·발권 앱인 티머니가 먹통이 돼 많은 승객들이 불편을 겪는 사건이 발생했습니다.
원인은 ‘네트워크 장비 오류’로 밝혀졌는데요. 티머니의 대중교통 점유 상황을 감안하면 자칫 ‘대란’으로도 번질 수 있는 사고였습니다.
그간 네트워크 오류가 대란으로 번져 전국민이 불편을 겪는 초유의 사태가 종종 있어왔는데요. 전문가들은 이러한 대란을 막기 위해 관리·감독 체계를 보다 강화해야 한다고 입을 모읍니다.
27일 오후 강원 춘천시외버스터미널에 버스 전산망 오류로 매표가 어렵다는 내용의 안내문이 붙어 있다.
(사진=연합뉴스)
29일 관련 업계에 따르면 지난 27일 오후 발생한 티머니 장애는 네트워크 장비 오류 때문에 발생했습니다.
티머니는 “1시6분경 티머니 전산센터 시스템 장애로 티머니 택시승인 서비스, 고속 시외버스 예매·발권 서비스에 오류가 발생했다”라며 “원인은 네트워크 장비 오류로 당일 오후 2시41분에 정상조치 됐다”라고 설명했는데요. 티머니가 대중교통(시내버스·지하철) 서비스도 사실상 독점하고 있는 것을 감안하면 유사 상황 재발 시 자칫 ‘대란’으로 번질 수 있다는 우려도 큽니다.
이번 장애는 LG CNS 데이터센터 내에 있는 티머니의 네트워크 장비 문제로 파악되는데요. LG CNS는 티머니의 지분 32.91%를 갖고 있는 2대 주주입니다.
LG CNS는 “당사 부평 데이터센터 네트워크 장비의 문제임을 확인 후 조치해 서비스를 정상화했다”라고 밝혔습니다.
LG CNS는 내년 상반기 중 코스피에 입성할 계획으로 상장을 준비 중입니다.
이번 티머니 사고와 관련 염흥열 순천향대 정보보호학과 교수는 “데이터센터의 경우 한 루트의 장애가 발생하더라도 장비의 이중화라든지 대체 경로를 통해 서비스 연속성을 제공하는 장애 관리 대책을 수립하고 있다”라며 “하지만 1시간30분 동안이나 장애가 발생했기에 보안 컴플라이언스(법규준수·내부감시)를 위한 대책 강화가 필요하다”라고 지적했습니다.
지난해 11월 발생한 행정전산망 마비로 지역 행정복지센터 안에 안내문이 붙어있다.
(사진=뉴시스)
툭 하면 ‘네트워크 장애’…일상화된 ‘대란’
네트워크 장애로 인해 많은 국민이 불편을 겪은 사례는 이번만이 아닙니다.
지난 2021년 전국의 KT 유·무선 인터넷이 마비된 사례를 비롯해 그간 많은 사고가 발생했는데요. 특히 KT 네트워크 장애 사고 이후 정부가 재발 방지 대책을 내놨지만, 계속해 반복되는 사고는 디지털강국 대한민국의 허울만 드러내는 모습입니다.
대표적인 것은 지난해 발생한 정부 행정전산망 마비 사태입니다.
지난해 11월17일 발생한 정부 행정전산망 장애는 일주일 사이 4번이나 먹통 사태를 일으켰는데요. 구체적 장애 원인은 각각 달랐지만 대부분 장비 장애나 관리 미흡이었습니다.
특히 정부 조사 결과 네트워크 장비인 라우터(서로 다른 내트워크를 연결해주는 장치)의 포트 불량이 주 원인인 것으로 드러났는데요. 라우터 장비 불량이 인증 시스템에 문제를 일으켰고 이와 정부24 등 사이트까지 영향을 받았다는 것인데, 많은 시민들은 필요한 서류를 떼지 못해 불편을 겪어야 했습니다.
이후 크고 작은 네트워크 장애 사태가 국민 불편을 초래했는데요. 올해 들어서 지속적으로 발생한 카카오톡 장애와 고용24·워크넷 등 정부 사이트 장애도 이에 속합니다.
지난 8월에는 서울과 충청 등 일부 지역에서 네트워크 장애로 인해 유선전화 수·발신이 불가한 사고도 발생했는데요. 당시 자영업자들은 장사를 하지 못해 발을 동동 굴렀습니다.
“네트워크 보안은 비용 아닌 투자…관리·감독 강화해야”
디지털이 중심이 되는 초연결사회는 많은 편의를 제공해 주지만, 기술적 오류나 해킹 등 사고로 네트워크 장애 발생시 국민들에게 심대한 피해를 끼칠 수 있는데요. 이에 많은 기업들이 사고의 예방과 피해를 최소화하기 위해 오류 대응 매뉴얼과 이중화된 복구 시스템 등 인프라를 구축하고 있습니다.
그럼에도 네트워크 사고를 100% 막기란 어려운데요. 이에 전문가들은 사고 발생 시 빠르게 복구해 서비스의 영속성을 유지할 수 있도록 관리·감독 체계를 강화해야 한다고 한 목소리를 내고 있습니다.
김정덕 중앙대 산업보안학과 교수는 “네트워크 사고를 막기란 어렵다.
좋은 장비도 오래되면 낙후되기 마련이고, 운영하는 사람이 관리를 잘못하면 사고가 날 수 있다”라며 “이는 사람도 마찬가지로, 스스로가 건강 관리를 하는 것처럼 기업들도 스스로가 주체의식을 가지고 네트워크 관리 체계를 만들어야 한다”라고 지적했습니다.
특히 국내 최고 수준의 보안 인증인 ISMS(정보보호 관리체계 인증) 등의 인증을 받는 것에만 그치지 않고 기업 스스로가 평소 관리를 통해 장애 대응 시스템을 구축할 필요가 있다는 지적도 나옵니다.
염 교수는 “ISMS 인증이 통과됐다고 하더라도 앞으로 잘 운영될 것이라고 장담할 수 없다”라며 “기업들이 보안 취약점이 없는지, 장애 대책이 문제가 없는지 계속 살펴보고 모니터링 해야할 필요성이 있다”라고 짚었습니다.
김명주 서울여대 정보보호학과 교수도 “실제 ISMS 인증을 받았다고 하더라도 실제 사고가 벌어지면 매뉴얼대로 안 움직이는 경우가 많다”라고 설명했는데요. 사고 재연 훈련을 위해 장비를 쓰려고 해도 해당 장비가 실제 서비스에 사용되고 있어 훈련을 할 수가 없다는 것입니다.
그러면서 “사고 발생 시 BCP(업무 연속성 계획)와 DRP(재해복구 계획)가 함께 움직여야 되는데 이러한 시스템을 평소에 실제 사건에 가깝게 훈련을 해봐야 한다”라며 “또한 기업들이 보안이나 유지보수를 비용으로 판단하지 않고 투자로 생각하는 등 발상의 전환이 필요하다”라고 제언했습니다.
배덕훈 기자 paladin703@etomato.com