화재 발생 40시간…완전 복구화 늦어져
카카오 자체 센터 없어…네이버는 '각' 이용
지난 15일 SK C&C 판교데이터센터 화재 발생으로 카카오 서비스 장애가 지속되고 있다. 회사 측은 데이터를 여러곳에 나눠 백업하는 '이중화' 조치를 했다고 주장했지만, 화재 발생 40시간이 지난 현 시점에도 완전 복구화가 이뤄지지 않고 있다. 반면 같은 위치에 데이터를 보관했던 네이버는 카카오보다 빠른 시간 내에 완전 복구했다.
17일 과학기술정보통신부(과기정통부)에 따르면, 카카오의 주요 서비스인 카카오톡(메신저), 다음(포털), 카카오맵(지도), 카카오T(모빌리티), 멜론·카카오TV·카카오스토리·카카오픽코마(콘텐츠), 티스토리 등 기타 9개 서비스 복구가 진행 중이다.
반면 네이버는 주요 4개 서비스(포털, 쇼핑, 시리즈온, 파파고) 중 포털 검색 기능을 제외한 3개 서비스가 완전히 복구됐다. 검색 서비스의 경우 일부 기능이 복구 중이나, 일상 이용에 큰 지장은 없는 상황이다.
현재 카카오는 판교 SK C&C데이터센터와 안양 등 전국 4곳에 데이터센터를 보유하고 있다. 이 중 이번에 화재가 발생한 SK C&C 데이터센터가 메인 데이터 센터다. 서버량만 3만 2000대에 달한다. 카카오가 전국에 배치한 4개 데이터 센터 중 가장 큰 규모로 알려졌다.
메인 데이터 센터에 화재가 발생하면서 데이터 작업이 늦어진 것이다. 실제 카카오 계열사 중 SK C&C데이터 센터를 메인센터로 삼지 않은 곳에서는 빠른 복구가 이뤄졌다. 별도 데이터센터를 둔 카카오뱅크의 경우 서비스 복구가 단기적으로 이뤄졌다.
카카오 측은 "화재 발생 이후 데이터 이원화 조치 적용을 시작했고, 재해복구(DR)훈련도 했지만, 이번처럼 데이터센터 하나가 한꺼번에 전원이 내려간 적은 처음이라 대응이 늦어진 것 같다"고 설명했다. 양현서 카카오 부사장은 전날 화재현장에서 열린 백브리핑 자리에서 "3만2000대의 서버 전체가 다운되는 것은 IT 역사상 유례가 없었던 것"이라며 "앞으로 서버를 증설하는 등의 조치를 취해 이용자에게 불편을 끼치지 않도록 할 것"이라고 말했다.
반면 네이버는 자체 데이터센터 '각'을 활용해 피해를 최소화했다. 메인 데이터 센터에 문제가 없었기 때문에 '데이터 이원화' 작업이 수월해진 것이다. 정수환 네이버 클라우드 본부장은 전날 열린 간담회에서 "서비스를 조금이라도 할 수 있었던 것은 IDC 장애에 대해 어느 정도 대응하고 있었다. 설령 어떤 장애가 나더라도 국지적인 기능 오류를 막을 수 있도록 준비했던 게 주효하지 않았나 생각한다"면서 "긴밀한 대응으로 조금이라도 빠르게 서비스를 복구했다고 본다"고 설명했다.
IT 업계 한 관계자는 "카카오 서비스 대부분이 많은 사용자 층을 보유하고 있는점을 감안하면 세심한 메뉴얼 수립에 각별한 관심을 기울였어야 한다고 생각한다"고 지적했다.
한편, 카카오는 판교 SK C&C 데이터센터 화재 직후 경영진과 각 부문 책임자들로 구성해 가동해온 대응 컨트롤타워를 ‘비상대책위원회’로 전환해 이번주 출범한다. 위원장은 홍은택 카카오 공동체 센터장이 맡으며, 본사와 주요 자회사의 책임자들이 참여할 예정이다. 이들은 원인 조사 소위를 비롯해 재난 대책 소위, 보상 대책 소위 등 3개 분과로 나뉘어 데이터 화재부터 보상안까지 준비할 예정이다.