정경원 시만텍코리아 사장 Kyung-won_chong@symantec.com
바야흐로 `빅데이터` 시대다. 빅데이터란 비정형 데이터가 기하급수적으로 증가하면서 기존 시스템의 처리·관리 용량을 넘어설 만큼 거대하게 생성된 데이터 집합을 의미한다.

지난해 IDC는 세계에서 새롭게 생성되거나 복제된 디지털 정보량이 1.8제타바이트를 넘어섰고, 약 2년마다 2배로 증가해 2020년에는 관리해야 할 정보량이 지금의 50배가 될 것으로 전망했다.
디지털 정보시대에 정보 폭증 현상이 새삼스러운 일은 아니지만 최근 빅데이터에 관심이 집중되고 있는 이유는 그 안에서 지금껏 깨닫지 못했던 유용한 정보를 유추해 다양한 용도로 활용할 수 있는 가능성 때문이다. 데이터 분석 전문가는 한 사람의 정보라도 상당한 양이 모이면 전혀 새로운 패턴을 보인다고 말한다. 이를 통해 소비자 취향이나 행태 변화를 추적할 수 있는 것이다.
실제 구글은 보건당국보다 앞서 독감 유행 징후를 감지하는 것으로 알려져 있다. 독감 증상이 있는 사람이 늘면 웹사이트에서 감기와 관련된 주제를 검색하는 빈도가 증가한다는 점을 착안했다. 회사는 여기에 맞춰 지역별 독감 유행 정보를 제공한다.
코카콜라도 시스모스 서비스를 이용해 세계 트위터 이용자들이 올리는 관련 정보를 분석하고 있다. 갑자기 특정지역에 비우호적 정보가 급증하면 홍보를 강화하는 등 실시간으로 대응하기 위함이다.
올해 다보스포럼도 빅데이터 관련 세션을 4개나 준비할 정도로 빅데이터에 큰 관심을 보였다. 다보스 포럼 사무국은 `빅데이터, 빅임팩트`라는 보고서를 통해 데이터가 새로운 `자산`이 됐다는 점을 강조했다. 향후 빅데이터를 분석해 상황을 예측하고 그에 맞도록 행동하는 기업과 기관만이 살아남는다는 메시지도 던졌다.
빅데이터 시대가 도래하면서 데이터 저장과 보호라는 그동안의 데이터 관리 개념 또한 크게 변하고 있다. 이제 기업들은 기하급수적으로 증가하고 있는 데이터를 올바로 관리하기 위해 데이터를 안전하게 백업 및 복구하는 것은 물론 효율적으로 활용하기 위한 방안을 모색해야 한다.
백업은 그동안 일종의 보험처럼 만일의 사태에 대비해 데이터를 저장하는 데 초점이 맞춰져 있다. 하지만 데이터량이 기하급수적으로 늘어나면서 이제는 데이터 저장에서 한발 더 나아가 효과적인 활용이 중시되고 있다.
문제는 기존 백업 및 복구 시스템으로는 빅데이터 대부분을 차지하는 비정형 데이터를 처리하는 데 한계가 있다는 점이다. 일례로 △낮은 백업 성능 △장시간 복구 △운영비용 및 자본 비용 상승 △테이프 분실 또는 잘못된 배치로 인한 리스크 △스토리지 효율성 부족 등의 한계가 그것이다.
따라서 빅데이터 시대의 데이터 보호 및 관리 체계는 보다 스마트해질 필요가 있다. 기존 숫자 중심의 정형화된 데이터뿐 아니라 웹·애플리케이션 로그 등 정형과 비정형 중간의 데이터, 이메일, SNS 메시지, 문서 등 비정형 데이터, 이미지 및 멀티미디어 데이터까지 관리할 수 있어야 한다. 여기에 데이터 중복제거를 통한 데이터 백업과 비즈니스 연속성을 보장하는 재해복구(DR) 등의 데이터 보호 솔루션 도입, 그리고 가상화 환경 데이터 보호 및 개별단위 복구를 위한 방안 마련도 중요하다.
기업 데이터의 가치가 높아지면서 데이터 손실로 초래되는 사회적·경제적 파장의 심각성이 대두되고 있다. 이 상황에서 여전히 국내 기업들은 데이터 보호 및 관리 시스템을 예산이 남으면 구축하는 불필요한 투자로 인식하는 경향이 강한 듯하다.
이제 데이터는 단순히 `만약을 대비해 저장해 두는 잉여 자산`이 아니라 기업의 미래 성장을 좌우할 밑거름이다. 우리 기업도 데이터를 스마트하게 관리하고 활용하기 위한 방안을 적극 모색해야 할 때다.


















