
기업 IT시스템의 ‘장애’가 ‘재해’ 수준으로 높아진 지 오래다. 시스템이 멈추면 업무 전체가 마비된다. 이에 최근 기업은 치열한 시장경쟁 속에서 서비스 신뢰성과 대외 신인도를 높이고 24시간 끊김 없는 서비스를 제공하기 위한 노력의 일환으로 재해복구 인프라 구축이 나서고 있다.
국내에서도 지난 9·11사태 이후 금융권을 중심으로 재해복구시스템 구축이 활발하게 이루어지기 시작해 제2금융권과 공공시장에도 적극적으로 도입되고 있는 상황이다. 그뿐만 아니라 최근에는 병원·학교 등을 비롯한 중소기업까지 재해복구시스템 구축 프로젝트가 꾸준히 늘고 있다.
이처럼 재해복구시스템 구축이 늘고 있는 것은 재해·지진·수해 등으로 인한 문제 발생보다는 시스템 업그레이드, 장비 장애에 따른 교체작업, 주전산 이전 문제 등의 이유가 더 크기 때문이다. 다시 말해 중단 없는 시스템을 구축함으로써 업무 효율성 및 투자수익률(ROI)을 극대화할 수 있다는 뜻이다.
그렇다면 안정적으로 재해복구시스템을 구축하고 운용하기 위해 우선적으로 고려해야 할 사항은 무엇인가.
먼저 기업의 IT 관리자는 기업 인프라 현황에 맞는 맞춤형 시스템을 구축함으로써 사전 계획된 작업에 의한 시스템 다운은 물론이고 예기치 않은 갑작스러운 재난에도 완벽하게 시스템을 보호하고 업무의 연속성을 유지할 수 있어야 한다.
또 운용·관리 측면에서도 재해복구 훈련과 같이 계획된 전환뿐만 아니라 언제 어느 때 시스템 전환 결정이 내려져도 원래 계획된 시간에 정상 가동되도록 평소에 다양한 재해 상황을 설정, 훈련해두어야 한다. 이는 실제로 재해 발생 시에 신속한 재해복구시스템으로 전환 가능한 시스템이 전제돼야 한다는 이야기다.
기술 또는 비용 문제로 형식적인 시스템을 구축하게 되면 정작 재해가 발생했을 때는 용량 부족, 시스템 환경 상이, 기타 여러 제약 조건으로 재해 복구가 이루어지지 못하는 일이 많다. 또 시스템이 잘 구축돼 있어도 재해복구용 서비스 네트워크가 제대로 구축돼 있지 않으면 큰 재해를 막을 수 없다는 점도 고려해야 한다.
무엇보다 진화된 재해복구시스템을 구축함으로써 유지보수 사항 변경, 기술 발전 및 내외부의 정책변화 등의 여러 가지 사유로 끊임없이 변화하는 IT 운용 아키텍처의 실제상황을 신속하게 반영할 수 있어야 한다. 시스템이나 업무 운용환경은 계속 변하기 때문에 구축 당시 정상 가동됐다고 해서 실제상황에서도 정상 가동된다는 보장은 없다는 점을 잊어서는 안 된다.
여기서 한 가지, 기업이 쉽게 범하는 오류를 지적하고 싶다. 기업은 핵심 서버의 백업을 수행하는 것만으로도 충분한 장애 관리가 이루어졌다고 생각하는 경우가 많다. 실상은 비즈니스 핵심 애플리케이션과 데이터는 대부분 직원의 데스크톱PC와 노트북PC에 저장된 경우가 많다. 그런데도 불구하고 클라이언트 백업은 소홀하기 그지없다. 문제가 발생해도 매출 손실과 생산성 약화 그리고 결국에는 고객 신뢰 상실로 연결되는 재해 상태에 빠지고 마는 것이다. 개인 PC 백업에도 더욱 많은 관심을 기울여야 할 시점이다.
기업이 얼마나 비싼 IT 인프라를 구축했고 얼마나 많은 IT시스템을 도입했는지는 더는 중요하지 않다. 급변하는 시장에서 기업의 IT 환경을 얼마나 안정적으로 운용하고 민첩하게 대응하느냐가 기업 경쟁력을 향상시키는 관건이 돼야 할 때다.
이제는 기업 비즈니스 신뢰성과 안정성을 높여줄 마스터키인 재해복구시스템의 본격적인 구축 운용 방법론을 논의하고 실제로 기업 IT 인프라에 적용해 기업 핵심 역량과 경쟁력을 키워나가야 할 때다.
◇이건우 아크로니스코리아 지사장 KunWoo.Lee@acronis.com