10년 전 발생한 911테러를 계기로 전 세계적으로 재해복구(DR)에 대한 인식이 확산되기 시작했다. 국내에서도 이 사건을 계기로 감독당국의 가이드라인이 구체화되는 등 DR 도입 움직임이 본격화하기 시작했다. 금융감독원은 은행과 증권, 카드사 등에 대한 전자금융업 감독규정에 3시간 복구목표시간(RTO)과 재해복구센터의 운영 지침을 포함시켰다.
2008년 금융위기 당시에는 금융권의 자금결제에 장애가 발생하면 경제 상황이 더욱 어려워질 수 있다는 판단에 따라 금융위원회 주도로 각 금융사별로 ‘금융전산부문위기대응매뉴얼’을 만들기도 했다. 재해의 유형과 심각성을 4~5단계로 구분하고 단계별로 필요한 대응 방안을 명문화해둔 것이다.
하지만 이러한 노력에도 불구하고 한국씨티은행 사태를 계기로 국내 금융권 DR 체계에 문제점이 있다는 지적이 다시 불거져 나오고 있다. 전문가들은 금융권 DR 체계의 근본적인 문제점으로 △주센터와 백업센터의 인프라 차이 △형식적인 모의 훈련 △의사결정에 대한 역할과 책임(R&R) 부재 △IT 중심의 DR 계획 등을 꼽고 있다.
◇주센터와 다른 DR 인프라가 복구 걸림돌=시스템적 관점에서 금융권 DR체계에 있는 가장 큰 위험 요소는 바로 주센터의 백업센터 사이의 인프라 구성과 규모가 같지 않다는 데 있다. 대형 금융사일수록 주센터에 필요한 인프라가 많기 때문에 상대적으로 백업센터에 있는 인프라 규모는 작을 수밖에 없다. 이는 언제 발생할지 모르는 재해에 대해서 막연한 투자를 진행할 수가 없기 때문이다.
따라서 은행권의 경우 재해가 발생했을 경우 당장 서비스가 필요한 계정계와 대외계 업무 위주로 백업센터에 이중화 체계를 구축해두고 있다. 하지만 고객관계관리(CRM)와 같은 정보계성 업무는 대부분 이중화에서 제외하고 있다.
박희경 기업은행 정보시스템부 팀장은 “주전산기, 원장관리, 인터넷뱅킹 등 대외계, 신용카드 순으로 중요도를 두고 이중화를 구축하고 있다”면서 “정보계나 내부 업무 등은 이중화 체계에서 제외돼 있다”고 말했다.
문제는 핵심 업무 위주라 하더라도 백업센터의 인프라 구성과 용량이 주센터에 비해 많이 열악하다는 데 있다. 계정계시스템 전체를 복구하기 위해서는 일시에 많은 하드웨어와 네트워크 용량이 필요하다. 그만큼 용량 증설에 시간이 필요하다는 얘기다.
또한 실시간 미러링이 돼 있다 하더라도 새로운 시스템에서 데이터를 인식하는 과정에서 오류가 발생하기 쉽고 짧은 시간 안에 정합성을 맞추기도 매운 어려운 일이다. 이런 상황 때문에 금융권에서는 웬만한 경우를 제외하고는 재해복구시스템을 가동시키는 것을 꺼려하고 있다. 데이터 오류로 인해 더 심한 사고가 발생할 수도 있기 때문이다.
업계 전문가들은 우선 재해로 입는 피해 비용과 재해복구 시스템 마련 비용 사이에 절충점을 찾는 게 중요하다고 충고한다. 즉 예상되는 피해 비용을 고려했을 때 어느 정도 수준에서 백업 체계를 구축하는 것이 효율적인지를 잘 따져봐야 한다는 것이다.
안재용 한국IBM 호스팅 재해복구서비스실장은 “재해 상황이 닥치면 업무 부하가 현재와 달라지고 특정 부분에 대한 부하는 굉장히 커지기 때문에 예기치 않은 트래픽에 대한 대비가 필요하다”면서 “백업센터의 가상화를 통해 공용자원을 이용함으로써 이런 부분에 대비해야 한다”고 말했다. 가상화 기술을 이용해 시스템 처리 용량과 관련된 이슈에 대응하는 것도 필요하다는 지적이다.
◇전사 관점 BCP로 접근해야=전문가들은 DR체계가 제대로 가동되려면 기존 전산센터에서 수행되는 업무 프로세스가 재해 발생 시 백업센터 내에서도 동일하게 이뤄져야 한다고 강조한다. 이를 위해 평상시에도 실전과 같은 모의 훈련이 이뤄져야 한다. 금감원은 1년에 최소 2회 이상 모의 DR 훈련을 시행할 것을 권고하고 있다.
하지만 대부분의 금융권 DR 모의훈련은 ‘훈련을 위한 훈련’에 그치고 있다는 지적이다. 즉 미리 예고되고 준비가 된 상황에서 하는 훈련은 아무런 의미가 없다는 얘기다. 영업시간 도중 불시에 주센터와 백업센터의 네트워크를 차단하고 재해를 선포한 후 복구에 착수하는 훈련이 필요하다. 이렇게 모의훈련을 실시한다고 하더라도 실제 상황에서는 프로세스가 달라지거나 데이터의 정합성을 맞추는 작업이 훈련 때와는 다른 경우가 많기 때문에 정해진 매뉴얼을 중심으로 꾸준한 반복 훈련이 중요하다는 설명이다.
서명교 LG CNS 솔루션사업본부 인프라솔루션사업부문 전문위원은 “신속한 DR 체계 전환을 위해서는 평소 거버넌스 체계를 잘 확립해 두고 이를 훈련에 반영해야 한다”고 조언했다. 예를 들어 최고 의사결정권자의 부재시 누가 재해를 선포할 것인지 등을 미리 정해둬야 한다는 얘기다. 서 위원은 외부 전문업체의 백업센터를 이용하는 고객사라면 시스템 인프라 준비와 데이터 복구와 관련해 업체의 역할과 책임(R&R)을 제대로 정의하는 것도 잊어서는 안된다고 강조했다.
전문가들은 금융권 DR 체계의 근본적인 문제점은 바로 IT중심의 DR 체계 수립에 있다고 지적한다. 금융권은 IT가 업무의 핵심이기 때문에 금융권의 비즈니스연속성계획(BCP)은 통상 IT부문의 DR시스템 도입이 전부인 것처럼 인식돼 왔다. 하지만 IT 외적인 사고로 인해 업무가 중단되는 일이 충분히 생길 수 있고 이럴 경우엔 전사적 대응만이 재해복구 시간을 단축하고 효과를 높일 수 있다는 분석이다.
서 위원은 “사업연속성을 위한 주요 프로세스는 IT가 아닌 비즈니스 중심으로 정립돼야 한다”면서 “전사 관점에서 리스크를 분석한 후 IT로 해결할 수 있는 방안을 찾아야 한다”고 말했다.
예를 들어 지점이 한 곳밖에 없는 시골의 한 은행에 화재가 발생해 그 지점의 고객들이 은행의 서비스를 이용하기 힘든 경우, 직원들이 파업을 하거나 사고를 당해 업무를 처리하기 힘든 경우, 본점 건물에 물리적인 이상이 생겨 대체 장소가 필요한 경우 등 IT 외적인 요인에 대한 업무 연속성 전략이 필요하다는 얘기다.
하지만 많은 금융기업들이 감사에서 지적당하지 않는 선에서 BCP를 세우고 있다고 많은 전문가들이 지적하고 있다. 단순히 IT 관점의 DR 체계가 아닌 전사적 차원의 BCP 체계가 필요한 시점이다.
안호천기자 hcan@etnews.co.kr
-
안호천 기자기사 더보기