카카오 블랙아웃, 기술보다 '문화'가 문제였다 : 리스크 관리
SK C&C 데이터센터 화재 사고로 지난 15일부터 서비스 장애가 지속되면서 카카오 서비스에 대한 신뢰가 땅에 떨어지고 있다. 카카오톡은 국민들의 주요 의사소통 수단이면서 코로나 등 재난 상황에서 이용되는 사실상 사회 주요 인프라로 인식됐다. 이런 인프라를 운영하는 기업의 대비와 장애에 대처하는 후속조치가 아쉬운 사건이다.카카오는 카카오톡을 기반으로 하는 금융 계열사를 보유하고 있다. 이에 금융감독원은 기존 비상계획(Contingency Plan) 외에 카카오뱅크, 카카오페이, 카카오페이 증권에 30시간 이상 지속된 서버 장애에 대한 대책 보고서를 제출할 것을 요청했다. 금융권은 재난 상황에 대비, 복구 등에 대해서 가장 강력한 규제 준수를 요구한다. 금융권 기준에서 이 정도의 서비스 중단은 '심각한 문제(Critical Issue)'로 분류된다. 금융감독원이 카카오 금융부문의 전반적인 비상계획과 주말 동안 데이터센터 화재로 인한 서비스 중단에 어떻게 대처했는지 조사가 이뤄지면 문제 원인이 들어날 것으로 보인다. 이번 카카오 사태는 거대 IT 플랫폼 기업의 재해, 재난 대처 실패 사례로 기록될 것으로 보인다. 성공적인 재난 복구(Disaster Recovery) 및 사업 연속성 관리(Business Continuity Management)를 위해서는 조직 문화와 관련 인력(Corporate Culture & People), 프로세스(Process), 기술(Technology) 등이 유기적으로 맞물려 신속하게 움직여야 한다. 주기적으로 재난상황에 대비한 가상 시나리오로 훈련과 연습을 반복하면서 실전에 대비해야 한다. 현재까지 상황은 카카오가 재난 상황에 대한 철저한 사전 대비, 사후 조치가 이뤄지지 않은 것으로 보인다.