기업 보유 데이터 중 40%가 3년 동안 방치된 파일이다. 효율적 데이터 관리가 시급하다.
베리타스코리아는 이 같은 기업 데이터 구성 현황을 분석한 `데이터 게놈 지수` 보고서를 22일 발표했다. 업계 첫 보고서로 데이터 유형별 비중, 생성 시기, 분포, 크기 등을 분석했다.
보고서에 따르면 규제 때문에 보관하는 데이터를 제외한 전체 데이터 중 41%는 3년간 접속이 없었다. 통상 3년간 데이터 접속이 이뤄지지 않으면 방치된 상태로 판단한다.
개발자 파일은 30% 이상을 차지한다. 파일 수로는 20%를 차지한다. 10년간 프레젠테이션 파일은 500% 감소했다. 스프레디시트, 오디오 파일, 텍스트 파일은 증가했다.
파일 생성이 많은 계절은 가을이다. 텍스트 파일 91%, 스프레드시트 48%, 지리적 파일 89% 늘어났다. 비디오 파일도 68% 증가했다. 여름과 가을에 비디오 촬영을 하고 사내 디스크에 저장한다.
주인 없이 방치된 데이터도 많다. 인사이동이나 직원 퇴사가 원인이다. 정보유출 발생 가능성이 높다. 다른 데이터보다 두 배 이상 데이터 공간을 차지한다.
데이터 현황을 파악해 비즈니스 중요 데이터를 우선 활용한다. 활용도가 낮은 데이터는 압축해 운영비용을 절감한다. 스티브 브라네스 베리타스 최고기술책임자(CTO)는 “메타데이터에 대한 베리타스 역량을 활용해 불균형적 데이터 관리 문제를 해소한다”고 말했다.
베리타스는 정보 거버넌스 솔루션 `엔터프라이즈 볼트 12`와 `데이터 인사이트 5.1`을 발표했다. 기업은 솔루션을 이용해 비정형 데이터를 관리한다.
신혜권 SW/IT서비스 전문기자 hkshin@etnews.com