기본 충실하지 않았던 '카카오 먹통' 사태… 무엇이 문제일까

기본 충실하지 않았던 '카카오 먹통' 사태… 무엇이 문제일까

머니S 2022-10-21 07:03:00 신고

3줄요약
지난 15일 발생한 SK C&C 데이터센터(IDC) 화재로 카카오, 네이버 등 국내 주요 플랫폼사의 서비스들이 중단되는 초유의 사태가 벌어졌다. 이번 사태는 위기 상황 시 네이버와 카카오의 대처가 명확하게 다르다는 점을 보여줬다. 운영하는 인력의 경험과 노하우에서 대처법이 차이가 난 셈이다.

카카오가 사용하는 일부 전력선이 네이버보다 먼저 끊기긴 했으나 카카오는 먹통 사태 나흘만인 지난 19일이 돼서야 대부분 정상화됐다. 반면 네이버는 이번 화재 발생 직후 데이터 차단을 했다. 또한 전력이 정상 공급되고 있던 90여분 동안 중요 데이터를 전부 다른 데이터센터로 옮기고 3시간 안에 대부분의 서비스들을 정상 복구시켰다.


백업 시스템 투자 소홀이 원인


이번 사태는 카카오가 백업 시스템에 대한 투자를 소홀히 한 게 원인이라는 분석이다. 가장 기본이 되는 서버 관리, 백업 시스템 도입, 이중화 등엔 소홀했다는 지적이 나온다.

네이버는 각 데이터센터의 서버 자원을 분산시켜 모든 서비스가 한 군데 몰리지 않게 했다. 내부 프로세서를 구축해 문제 발생 시 서비스 전체가 아니라 일부가 문제가 되도록 설계를 해놨다. 따라서 비상 상황이 발생하면 주변 데이터센터를 활용할 수 있다.

카카오는 판교와 안양 등 총 4곳의 데이터센터에 서버를 분산해 놨다. 이중화로 한 곳에서 재난·재해가 발생해도 다른 곳의 백업 데이터로 서비스를 즉각 재개할 수 있도록 했다. 문제는 이번에 화재가 난 SK C&C 데이터센터에 무려 3만2000대의 서버를 운용하고 있다는 점이다. 즉, 데이터를 분산했지만 한 곳에 메인 서버가 몰려있는 것이 문제인 셈이다.

카카오는 지난 19일 기자간담회에서 "복구가 지연된 원인은 서비스의 주요 데이터와 서비스 응용프로그램에 대한 이중화 조치는 되어 있었으나 개발자들의 주요 작업 및 운영 도구가 이중화되지 못한 데 있다"고 밝혔다.

주요 데이터 자체는 이원화 작업이 돼 있어 유실이 없었으나 꺼진 서버를 매칭해주는 '서버 자동화 배포 시스템'이 작동하지 않아 시간이 오래 걸렸다고 설명했다.

업계에서는 카카오가 판교 데이터센터 한 곳에 메인 시스템을 몰아놓고, 이중화를 부분적으로 해 사실상 안 한 것이나 마찬가지라는 지적이 나오고 있다.

양사의 클라우드 사업 역량 차이도 원인이 됐다. 카카오는 클라우드는 신설된 지 얼마 되지 않았으며 점유율도 낮다. 반면 네이버클라우드는 서버망부터 데이터망 설계까지 사고가 생겼을 때 예방하기 위한 여유 데이터 저장 공간 등 노하우가 풍부하다. 네이버는 자체 데이터 센터를 보유하고 있는 것이 강점이다. 데이터 센터를 구축하고 데이터 백업에 주력하고 있다.


기본적인 재해복구시스템도 미흡


기본적인 재해복구 시스템(DR·Disaster Recovery)이 미흡했다는 비판도 나오고 있다. 카카오가 재난 발생 시의 대비책을 마련해 놓지 않았던 것은 아니다. 재해복구를 위해 서버 및 데이터를 4개의 데이터센터에 이원화해두고 있다고 밝힌 바 있다.

문제는 카카오가 데이터센터 전체가 한 번에 셧다운되는 상황까지 예측하지 못했다는 점이다. 재해 발생을 가정한 서버 전환 훈련도 충분히 이루어지지 못했다. 창사 이래 카카오는 데이터센터 셧다운에 대한 훈련을 단 한 번도 하지 않은 것으로 드러났다.

홍은택 카카오 대표는 지난 19일 기자간담회에서 "카카오톡의 경우 트래픽이 매우 많은 서비스여서 비상 계획 가동이 많았다. 연말 '제야의 종' 때 가장 트래픽이 많아서 모의 훈련을 하는 등 수시로 해왔다"면서도 "이번처럼 데이터센터 셧다운을 대비한 훈련은 없었던 것으로 안다"고 말했다.

업계 관계자는 "대기업의 경우 시스템적으로 메뉴얼이 전수가 되지만, 카카오는 시설관리 방식에서 체계적이지 못했다"며 "최근 10년간 급격하게 고속 성장해 대기업이 됐지만 그에 걸맞는 수준을 갖추지 못했다는 방증"이라고 설명했다.

이번 사태는 '초연결 사회'의 문제점을 고스란히 보여줬다. 이용자가 무려 4750만명에 달하는 '국민 메신저'인 만큼 전문가들은 완전한 이중화 작업이 필요하다고 조언한다.

김승주 고려대학교 정보보호대학원 교수는 "국내 메신저 시장에서 점유율이 90%에 육박하는 카카오톡은 사실상 공공재에 가깝다"며 "카카오는 보다 더 최악의 상황들을 가정하고 대응책을 마련해 뒀어야 했다"고 지적했다.

김형중 고려대학교 정보보호대학원 특임교수는 "대형 기업이면 데이터 관리가 중요한데 사고가 날 것에 대해서 대비를 하지 않은 것이 가장 큰 문제"라며 "데이터를 관리하려면 자체 IDC가 있어야 하지만 카카오의 경우 위탁관리를 했기 때문에 직접적으로 대응하지 못했다"라고 분석했다.

이어 "이중화를 안 한 것이 문제이고, 글로벌 기업 수준에 맞게 이중화·삼중화를 해야 한다"며 "이번 사태를 전화위복으로 삼아 카카오는 '데이터' 관리의 소중함을 알아야 한다"고 강조했다.

Copyright ⓒ 머니S 무단 전재 및 재배포 금지

본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.

다음 내용이 궁금하다면?
광고 보고 계속 읽기
원치 않을 경우 뒤로가기를 눌러주세요


이 시각 주요뉴스

당신을 위한 추천 콘텐츠

알림 문구가 한줄로 들어가는 영역입니다

신고하기

작성 아이디가 들어갑니다

내용 내용이 최대 두 줄로 노출됩니다

신고 사유를 선택하세요

이 이야기를
공유하세요

이 콘텐츠를 공유하세요.

콘텐츠 공유하고 수익 받는 방법이 궁금하다면👋>
주소가 복사되었습니다.
유튜브로 이동하여 공유해 주세요.
유튜브 활용 방법 알아보기