최근 정부3.0 등 공공데이터 개방 및 공유와 관련된 정부 정책에 따라 데이터 품질이 가장 큰 이슈로 대두되고 있다.
전 세계는 사물인터넷과 웨어러블 디바이스, 빅데이터 등 데이터 기술의 비약적 발전에 따라 데이터의 폭증을 예고하고 있다. 시장조사기관에 따르면 사물인터넷으로 디지털 데이터가 향후 2년마다 두 배씩 증가해 오는 2020년에는 44조기가바이트(GB)에 달할 것이라는 예측이다.
우리나라 역시 개인뿐만 아니라 공공기관과 민간 기업에서 만들어내는 데이터가 기하급수적으로 늘어나는 추세다. 이러한 데이터를 활용한 다양한 서비스의 개발로 인해 DB간의 통합·연계 요청이 쇄도하고 있다. 동시에 기업들이 공공DB를 자사의 DB서비스에 직접적으로 이용하거나, 자사 DB와의 매시업을 통해 새로운 DB를 창출하는 모델도 나타나 공공DB에 대한 관심이 증가하고 있다.
하지만 우리나라는 아직 공공데이터 개방과 활용에 있어서 초기단계로 제공되는 데이터의 표준 미비, 공개 데이터에 대한 가이드라인 부재 등 데이터 품질 미확보로 공공데이터 활용에 어려움을 겪고 있다. 데이터를 이용하는 사용자 입장에서는 공공기관·지자체마다 제공하는 데이터 포맷이 일치하지 않아 이를 취합해 사용하기 어렵다. 또 데이터를 제공하는 기관에서는 정확한 사용자 수요 파악이 어렵고 데이터 개방에 대한 명확한 기준이 없다.
실제로 우리나라 공공데이터 품질관리 성숙수준은 0.9레벨로 공공분야 데이터 품질관리 활동 수행 비율은 33.3%에 불과하다. 데이터 품질관리에 대한 인식 또한 낮은 것으로 조사됐다.
따라서 공공데이터의 활용 확산을 위해 정기적 품질교육·세미나를 통한 전문인력 양성, 품질진단·인증, 우수기관 인센티브 제공 등 제도화 등으로 데이터 품질관리에 대한 인식 제고와 품질관리 활동의 정례화가 필요하다는 목소리다.
데이터 품질관리는 데이터 자체의 정합성에 국한된 것이 아니라 데이터를 관리하고 관련 시스템을 운영하는 조직의 체계, 그리고 데이터 유출과 보안체계까지 포함해 폭넓게 접근해야 한다.
한국데이터베이스진흥원은 지난 2010년부터 기업의 데이터베이스 품질 성숙수준을 심사하는 데이터베이스 품질인증제도(DQC:Database Quality Certification)를 운영 중이다.
이를 통해 기업의 데이터베이스 품질 현 수준과 문제점 그리고 데이터베이스 품질 개선에 필요한 단계적인 해결 방안을 제시하고 있다. 한 데이터베이스 품질 우수사례를 공유해 데이터베이스 품질체계 도입을 준비하는 기관·기업이 벤치마킹할 수 있도록 지원하고 있다.
윤대원기자 yun1972@etnews.com