지난 7월 마이크로소프트(MS) 서비스 장애로 전 세계 항공, 금융, 기업 등 IT 시스템이 마비되는 사고가 있었다. 장애 원인 제공자는 미국 사이버 보안 회사인 크라우드 스트라이크였다. 전 세계에 2만여 고객사를 보유한 크라우드 스트라이크가 신규 보안 소프트웨어(SW)를 업데이트하면서 해당 작업이 MS 운용체계(OS)와 충돌을 일으킨 것이다. 이 사건 여파로 단일 클라우드 안정성 문제가 도마 위로 올랐다. MS와 같은 단일 클라우드 기업의 중앙 시스템에 문제가 생길 경우, 해당 시스템과 연계된 전 세계 인프라도 동시다발로 중단될 수 있다는 걸 보여줬다.
국내에서는 MS 장애 여파가 상대적으로 약했다. MS 클라우드나 크라우드 스트라이크 보안 서비스를 이용하는 고객이 적기 때문이다. 하지만 업계에서는 글로벌 IT 대란이 국내에서는 재현되지 않도록 예방책에 대한 논의가 한창이다.
MS 장애 영향으로 많은 기업이 자사 서비스 안정성을 높이기 위해서 재난 대응 전략을 궁리하고 있다. '멀티 클라우드 도입' '일원화된 클라우드 관리 체계 구축' 등 기업이 처한 상황에 따라 택할 수 있는 선택지는 많다.
가장 주목받고 있는 대안은 멀티·하이브리드 클라우드다. 멀티 클라우드는 복수의 클라우드 서비스를 이용하는 형태를 말한다. 하이브리드 클라우드는 퍼블릭 클라우드와 물리 인프라 또는 프라이빗 클라우드를 결합하는 서비스다. 멀티·하이브리드 클라우드를 이용해 기업의 서비스를 다중화하면 한 클라우드에 장애가 생겨도, 다른 클라우드 또는 물리 인프라로 서비스를 지속할 수 있다. 이러한 이유로 정부도 MS 장애 사태 대비책으로 재난관리 의무 사업자에게 2개 이상의 클라우드로 주요 서비스를 다중화할 것을 권고하기도 했다. 멀티·하이브리드 클라우드는 IT 인프라를 분산시킨다는 측면에서 서비스 가용성을 높일 수 있는 최적의 대안이다.
국내에서 멀티·하이브리드 클라우드 도입이 더뎠던 이유는 '멀티·하이브리드 클라우드는 비싸다'는 인식이 팽배하기 때문이다. 멀티·하이브리드 클라우드로 서비스를 이중화할 경우 비용도 이중으로 든다는 것이다. 하지만 최근에는 기업 예산에 맞춰 멀티·하이브리드 클라우드를 제안하는 공급사도 늘고 있다. 공급사 설계 능력에 따라 비용은 달라진다. 국내외 다양한 종류의 클라우드 서비스를 운영 대행한 경험이 있는'클라우드 관리 서비스 공급사(MSP)나 클라우드는 물론 물리 인프라(온프레미스)도 함께 공급·관리한 노하우가 있는 공급사를 물색한다면 합리적인 예산 내에서 멀티·하이브리드 클라우드를 구축할 수 있다.
기업 사정상 멀티·하이브리드가 아닌 단일 클라우드를 유지해야 하는 기업에도 대안은 있다. 클라우드 서비스 선택 시 클라우드 공급-운영-보안을 모두 책임질 수 있는 공급사를 선정하면 된다. 단일 공급사가 클라우드 서비스의 전 과정을 총괄할 경우 장애가 발생하더라도 신속하게 대응할 수 있다. 대부분의 국내 기업은 클라우드 도입과 운영, 보안을 담당할 공급사를 각각 선정해 관리하고 있다. 이 경우 장애 발생 시 장애의 원인이 클라우드 인프라의 문제인지, 운영 또는 보안 문제인지 파악하기 어렵다. 반대로 클라우드 서비스 전반을 단일 공급사가 총괄할 경우, 전방위적인 원인 파악과 대안 적용이 가능해 장애에 대한 통제력이 높아진다.
오석 가비아 클라우드사업팀장은 “이번 MS 사태의 근본 원인은 외부 보안 SW 업데이트로 인한 것으로, 클라우드 서비스 공급사(CSP)가 보안 업데이트까지 통제하는 데는 한계가 있는 것이 사실”이라면서 “CSP가 클라우드 운영과 보안 영역까지 총괄하고 있을 경우, 철저한 검증과 단계적 적용 등을 통해 문제 가능성을 차단하고, 만에 하나 문제가 발생해도 일원화된 관리 채널을 활용해 피해를 최소화할 수 있다”라고 말했다.
김현민 기자 minkim@etnews.com