미국 클라우드플레어에서 서비스를 제공받는 모든 웹사이트에서 접속 장애가 발생했다. 메신저 '디스코드', 데이팅앱 '오케이큐피드(OKCupid)' 암호화폐 거래소 '코인베이스' 등 클라우드플레어를 이용하는 1600만개 이상의 서비스가 2일(현지시각) 최장 1시간 동안 장애를 겪었다.
클라우드플레어는 콘텐츠딜리버리네트워크(CDN) 및 도메인네임시스템(DNS) 서비스를 제공하는 업체다. 전 세계 75개국에 180개 이상 데이터센터를 운영하고 있으며 전 세계 수많은 업체가 서비스를 이용하고 있다.
한국 이용자들 역시 피해를 입었다. 국내 사이트 방문자 수 10위권 '나무위키'를 포함 '일간베스트' '루리웹' 등 대형 사이트 상당수가 먹통이 됐다. 접속을 시도하면 서버 과부하 혹은 잘못된 네트워크 연결을 의미하는 '502 Bad Gateway' 오류 화면이 출력됐다. 이용자들이 원인을 찾아 나서면서 포털사이트 실시간 검색어 1위에 '502 Bad Gateway'가 등장했다.
클라우드플레어는 문제 발생 30여분 만에 공식 블로그를 통해 “문제를 해결했으며 상황을 모니터링 중”이라고 밝혔다. 조치 후 사이트 접속은 재개됐으나 다시 클라우드플레어 애널리틱스 서버로 문제가 옮겨갔다. 모든 서비스 정상화까지는 약 5시간이 소요됐다.
문제 원인으로는 같은 시간 발생한 중국발 초대형 디도스(DDOS) 공격이라는 해석이 가장 유력했으나, 클라우드플레어 측은 이를 강하게 부인했다. 메튜 프린스 클라우드플레어 대표는 “아직 공격이 있었다는 증거는 발견되지 않았다. 성급한 결론을 내리지 말라”고 해명했다.
회사 측은 “클라우드플레어에 새로운 웹응용프로그램방화벽(WAF)을 도입하는 과정에서 잘못된 규칙이 적용됐다”며 “이 규칙은 공격에 사용되는 자바스크립트를 차단하려는 목적이었으나, 전 세계에 있는 우리 장비 CPU 사용률을 100%까지 급격히 끌어올릴 수 있는 잘못된 계산식이 들어있었다”고 설명했다.
아울러 “우리는 이와 같은 사건이 우리 고객들에게 매우 고통스럽다는 것을 안다”며 “향후 이같은 사고를 피하기 위해 테스트 및 배포 프로세스를 검토하고 변경할 것”이라고 덧붙였다. 다만 이번 사고로 피해를 본 고객들의 보상 여부는 언급하지 않았다.
이형두기자 dudu@etnews.com