토요일 오후 3시 정도 부터 카카오톡이 정상적으로 접속되지 않았는데요. 3일이 지난 지금은 어느 정도 복구가 되어가고 있는 것으로 보이죠. 지금 제가 쓰고 있는 카카오에서 운영하는 블로그인 티스토리도 오늘 오후에서야 정상화가 된 것 같습니다. 한 2주 전에도 카카오톡이 일정 시간 동안 장애를 일으켜서 불편함을 초래했었던 일이 있었는데, 문제는 이번 사태의 경우 카카오톡뿐만 아니라 택시를 호출하는 카카오T와 뱅킹 앱인 카카오뱅크 등이 모두 서비스가 불가하다는 점이었죠. 그래서 오늘은 왜 이런 먹통 사태가 벌어졌는지와 함께 제가 생각하는 근본적인 원인에 대해 말씀드려보도록 하겠습니다.
아마 잘 생각해보면 유독 카카오톡만 이렇게 서비스가 불가한 먹통 사태가 종종 있었던 것 같은데요. 6년 전에는 지진이 발생해서 카카오톡이 한 동안 먹통인 적이 있었고, 이런 저런 이유로도 짧은 시간 동안 사용하지 못했던 경험을 다들 하셨을 겁니다. 이번 먹통 사태의 경우 판교에 있는 데이터센터에 화재가 발생하여 서비스가 불가하였다고 하죠. 해당 지역은 SK에서 운영하고 있는 데이터센터인데, SK그룹 측에서 안전을 위해 데이터센터의 전원 공급을 차단하면서 카카오와 네이버의 일부 서비스에 장애가 발생했다고 합니다.
그런데 문제는 네이버의 경우는 일부 서비스만 해당 데이터센터를 이용하고 있었고 일부 이중화 장비를 통해서 해당 장애를 해결했음에도 카카오톡은 전혀 그러지 못했는데요. 일반적으로 기업들에서는 물리적으로 위치가 떨어진 곳에 이중화 장비를 구성해 놓고, 화재나 지진 등 재해로 인해 서비스가 불가한 경우 해당 장비를 가동하여 복구 시스템이 동작하도록 합니다. 사실 기업들 입장에서 얼마 되지 않는 시간이라도 자신들의 서비스가 동작하지 않으면 금전적으로 큰 손해를 보기 때문이죠.
그리고 카카오톡의 경우 정보보호 관리체계라고 하는 국가에서 부여하는 보안 인증을 받고 있을텐데요. 일정 규모 이상의 기업에서는 이 인증을 필수적으로 받아야 하는데, 위에서 말씀드린 이중화 장비처럼 재해가 발생해도 몇 시간 이내 서비스를 재가동하도록 재해 복구 시스템을 갖추는 요건을 만족해야 합니다. 그런데 카카오와 같은 큰 기업에서 장애가 발생한지 몇 시간이나 지나도록 복구를 못한다는 것은 이러한 재해 복구 시스템을 갖추지 못한 것으로 봐야겠죠.
카카오톡 먹통, 데이터센터 불났다... 네이버도 일부 서비스 불통
카카오톡이 오후 3시 반부터 오류로 전송이 안되는 등 정상적으로 작동하지 않고 있다. 원인은 SK 판교 데이터센터에서 발생한 화재 때문이며, 카카오 측은 8~9시쯤 정상화될 것이라고 밝혔다.
www.boannews.com
개인적으로 카카오톡과 같이 전국민이 사용하는 앱을 이렇게 몇일 동안 제대로 복구하지 못한다는 것 자체가 기업에서 너무 안일하게 대처한 것이 아닌가 싶습니다. 이런 일들이 한 두번 있었던 것도 아닌데, 카카오에서도 재해 복구 시스템을 제대로 갖추지 않았다는 것도 너무한 듯 보이는데요. 이번 사태를 기점으로 카카오뿐만 아니라 여러 기업에서도 장애에 빠르게 대처할 수 있도록 하는 시스템을 갖추는 계기가 되었으면 합니다. 다음에는 이런 일이 발생하질 않길 바라며 이번 글은 여기서 마치도록 하죠. 감사합니다.
'Security Essay' 카테고리의 다른 글
디지털 포렌식 활용한 압수수색 요건 강화 사례 (0) | 2022.10.20 |
---|---|
카카오 화재로 본 ISMS-P 인증 실효성 논란 (0) | 2022.10.19 |
네이버 클라우드 마이박스 사칭 공격 메일 사례 (1) | 2022.10.08 |
모네로 코인 채굴 악성코드 유포 사례 (1) | 2022.09.17 |
수술실 CCTV 설치 의무화 의료법 개정 사례 (1) | 2022.09.11 |
댓글