관계 부처 6일 디지털서비스 장애 조사결과 발표
"화재 세부 대응계획·모의훈련 없어"
SK C&C에는 '화재감지 시스템 구축' 요구
카카오에는 '서비스 다중화' 요구
방통위, 무료 서비스도 장애시 고지 의무화
카카오 등 3사, 시정 요구사항 적극 반영
[아시아경제 최유리 기자, 차민영 기자] 정부가 지난 10월 '판교 데이터센터 화재' 사고 원인 조사 결과 브리핑에서 카카오 서비스 장애로 인한 피해접수 건수가 10만5000여건에 달한다고 6일 밝혔다. 정부는 SK C&C·카카오·네이버 등 3사에 1개월 내 주요 사고원인에 대한 개선 조치와 향후 계획을 수립해 보고해 달라고 당부했다. 사업자들도 정부의 시정 요구 사항을 적극 반영한다는 방침이다.
발화 조기 감지 못해…세부 대응계획·모의훈련 부재
과학기술정보통신부, 방송통신위원회, 소방청은 이날 공동 브리핑을 통해 SK C&C 판교 데이터센터 화재 및 카카오·네이버 등 부가통신서비스 장애에 대한 조사 결과를 발표하면서 이같이 밝혔다.
지난 10월 15일 SK C&C 판교 데이터센터 화재 발생으로 인한 카카오, 네이버 등 입주기업의 서비스 장애가 발생했다. 카카오의 경우 20일 23시경 정상화돼 장애 복구에 127시간 33분 소요됐다. 네이버는 일부 기능 오류가 발생했다. 주요 서비스·기능 대부분은 약 20분~12시간 내 정상화됐다. 정부도 즉각 과기정통부 장관을 본부장으로 하는 '방송통신재난 대책본부'를 꾸렸다. 방통위는 카카오 등 사업자에 피해접수 전담 창구 개설과 피해보상 협의체를 마련토록 했다.
정부의 사고 조사·분석 결과에 따르면, 화재는 당일 23시 45분에 진화됐다. 전력은 19일 새벽 5시경 정상화됐다. SK C&C 판교 데이터센터의 경우 배터리 온도 등을 모니터링하는 시스템(BMS)을 갖췄으나 화재 징후를 감지하지 못한 것으로 나타났다. 온도도 화재 직전까지 정상 수준을 유지해 온도 센서 외에 화재 조기 감지를 위한 보완 장치의 필요성이 제기됐다.
발화는 지하 3층 내 배터리실에서 시작됐다. 배터리실 내 상부에 위치한 전력선과 천장공간이 미분리된 격벽 공간에 있었던 일부 UPS가 화재로 인한 열 등(추정)으로 손상돼 작동이 중지됐다. 살수 시 누전 등 2차 피해 방지를 위해 전력 차단 조치가 결정됐다. 특히 화재 발생 후 가스 소화 장비가 작동했으나 가스 소화가 어려운 리튬이온 배터리 화재 특성상 초기 진압에 한계가 있던 것으로 파악됐다. 리튬이온 배터리가 일부 무정전 전원 장치(UPS)와 물리적으로 완벽히 분리되지 않아 UPS의 작동이 중지돼 전원공급도 멈췄다. 화재 대비 매뉴얼은 있었으나 실제 화재상황 수준까지 반영한 세부 대응계획과 모의훈련은 없었던 정황도 드러났다.
카카오 서비스 장애로 인한 피해 접수 건은 10만5116건으로 집계됐다. 유료 서비스에 대한 피해는 1만4918건, 금전적 피해를 언급한 무료 서비스는 1만3198건이 접수됐다. 네이버는 데이터센터 간 이중화 조치를 해 서비스 중단은 없었다. 하지만 쇼핑몰 내 상품 리뷰 미노출, 뉴스 일부 댓글 이용 불가, 파파고 발음듣기 기능이 오류를 일으키는 등 일부 피해를 보았다.
정부, 3사에 선제 조치 당부…1분기 종합계획 수립
과기정통부는 3사에 단기간 내 조치 가능한 사항은 각 사가 선제 조치해달라고 당부했다. 중·장기적으로 조치가 필요하거나 구체적 방안 마련 등이 필요한 사안은 향후 1개월 내 조치계획을 보고해 달라고 했다. 정부는 정책 방안을 마련하면서 각사가 제출한 조치 결과와 향후 계획, 재난예방·복구에 대한 의견 등을 반영할 계획이다. 전문가 의견 수렴까지 거쳐 내년 1분기 내로 디지털서비스 안정성 확보를 위한 종합 개선방안도 수립, 발표한다.
데이터센터 운영사인 SK C&C에는 배터리모니터링시스템 계측정보 등 관리 강화 방안 및 현재 배터리 모니터링 시스템 외 다양한 화재감지 시스템을 구축할 것을 촉구했다. 리튬이온 배터리 화재 시 필요한 소화설비 등의 구축하고 불가능할 경우 별도의 대안을 마련해 달라고 했다. 배터리와 기타 전기설비 간 물리적 공간을 분리하고 배터리실 내에 위치한 전력선을 재배치해 구조적 안정성을 확보하고 대안 조치를 강구할 것도 요구했다. 화재 등 재난 발생 구역의 전력을 개별 차단하고 재난 현장에 직접 진입하지 않고도 해당 구역의 전력 차단 등이 가능하게 해달라고 했다. 이와 별도로 재난대응 시나리오를 개발하고 세부 훈련 계획을 수립하는 한편, 훈련 실시 결과도 보고하라고 했다.
카카오에는 서비스 다중화를 요구한다. 장애 복구 지연의 핵심 원인인 ‘운영 및 관리도구’를 데이터센터 간 매우 높은 수준의 다중화를 적용하도록 한다. 인증 등 주요 기능에는 현재보다 높은 수준의 분산 및 다중화를 적용할 수 있는 방안을 수립도록 한다. 재난 대비 모의훈련 실시, 시나리오별 신속 장애 복구방안 수립도 촉구한다. 서비스 장애 발생 시 다양한 방식으로 신속하게 이용자에게 고지할 수 있는 체계를 구축하고, 국민 피해 구제 원칙과 기준을 설정하고 보상 계획을 수립해달라고 당부했다.
네이버에는 서비스별 복구 목표, 장애 시나리오별 복구 방안 등을 재점검해 개선방안을 마련하고 주 데이터센터 전소 등 상황을 가정해 모의 훈련을 실시해 달라고 요구했다.
방통위, 이용약관 개선…무료 서비스도 장애시 고지 의무화
방통위는 이용자 보호 대책을 마련한다. 향후 통신장애 발생 시 이용자 고지와 실효성 있는 피해 구제를 위한 법령 및 이용약관 등 개선방안을 마련할 계획이다. 당초 카카오 등 부가통신사업자는 통신 서비스가 중단될 경우 이용자에게 고지해야 한다. 현재는 유료 서비스 이용자에게만 고지하면 돼 이를 무료 서비스 이용자까지 대상을 확대한다.
권희수 방통위 이용자보호과장은 "(유료 서비스와 무료 서비스 장애에 따른 고지) 범위가 다르기 때문에 무료 이용자에 대한 고지 부분도 포함시키는 방안으로 진행 중"이라며 "약관 개선을 우선 하고 고지 관련 전기통신사업법 개정이라든지, 방통위에서 제도 개선 내용을 개정안에 포함시킬 것"이라고 밝혔다. 내년 1분기 과기정통부 발표 전까지 방안을 마련할 계획이다. 그는 다만 무료 서비스 장애에 따른 보상을 이용약관에 명시하는 방안에 대해선 "이용약관 내 피해 보상 방안을 전반적으로 들여다보고 개선을 유도하겠다는 뜻"이라면서 "무료 서비스 장애 보상 방안을 약관에 포함시키는 것은 관련 법령 근거가 없고 현실적으로 어려움이 있다"고 짚었다.
기업들도 정부에 협력 의사 밝혀
기업들도 정부에 협력한다는 방침이다. SK C&C·카카오·네이버 등 3사는 과기정통부가 발표한 시정 요구 사항을 적극 반영하고 안정적인 서비스 운영에 최선을 다하겠다는 입장이다. 카카오는 오는 7일 개발자 컨퍼런스인 '이프 카카오'를 통해 자체 분석한 서비스 장애 원인을 밝히고 재발 방지 대책을 공개한다.
SK C&C 관계자는 "배터리 모니터링 시스템을 포함해 다양한 화재 감지·대응 시스템 보강을 검토 중"이라며 "대형 화재 상황을 고려한 재난 대응 시나리오와 세부 훈련 계획도 수립하고 있다"고 말했다. 카카오 관계자는 "정부가 발표한 시정 요구 사항 중 보강할 부분이 있다면 적극 검토해 반영하겠다"고 밝혔다. 네이버 관계자는 "정부의 시정 요구 사항을 참고해 앞으로도 중단없는 안정적인 서비스 운영에 최선을 다할 것"이라고 말했다.
최유리 기자 yrchoi@asiae.co.kr
차민영 기자 blooming@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>