[핫이슈]빅데이터 시대 경쟁력, 데이터 품질이 대안

관련 통계자료 다운로드 국내 DB산업시장 전망

공공·민간에서 구축·활용되는 데이터의 양은 매년 큰 폭으로 늘어나고 있다. 최근 스마트폰 등 모바일 기기 확산과 정보 개방화, 융·복합화 등 정보 이용의 패러다임 변화에 대응하기 위해 데이터베이스(DB) 활용에 요구가 증가하고 있다. DB 활용 요구를 골고루 충족시키기 위해서는 데이터의 품질을 사전에 확보해야 한다. 그러나 `공감대 부족` `예산확보의 어려움` 등 이유로 체계적인 품질 관리는 커녕 데이터 품질 개념 조차 정립하지 못한 것이 국내 데이터 품질관리의 현주소다.

최근 오류 데이터로 인한 피해 사례가 속출하고 있다. 개방·공유·협업 기반의 지식 정보사회에 진입하기 위한 위해 요소로 작용될 것이다. 데이터 품질관리 현황을 파악하고 모범 사례를 발굴해 품질관리 수준을 향상시키고자 한다.

◇데이터 사용량 급격히 증가=우리나라 DB산업은 2011년도 시장 매출 규모가 10조4000억원에 달해 성장률이 9.7%를 넘었다. 2010년 국민총생산 성장률이 3.7%였던 점을 감안하면 다른 산업을 견인하는 고성장 산업인 셈이다.

`빅데이터`의 등장은 DB산업계에도 화두다. IDC 발표에 따르면 2011년 2분기 데이터 총 용량은 5429페타바이트로, 전년 2분기보다 30.7% 증가하는 등 데이터 양 증가 속도는 예측할 수 없을 정도다. 폭발적으로 증가하는 정보환경에서 DB활용에 대한 요구가 증대되고 있다. 이에 따른 데이터 품질의 중요성도 더욱 강조되고 있다.

최근 스마트 기기 열풍은 DB산업의 생산과 활용방식을 급격히 변화시키고 있다. 기관과 기업은 스마트 기기를 활용, 업무효율성을 향상하고 데이터베이스 활용을 극대화한다. 그러나 스마트폰, 스마트패드, 스마트TV 등 다양한 모바일 환경에 적합한 사용자 인터페이스를 제공해도, 서비스 근간이 되는 DB 품질이 확보되지 않으면 서비스 신뢰도와 만족도는 현저하게 낮아진다.

◇공공 DB 품질 현저히 낮아=한국데이터베이스(DB)진흥원에 따르면, 2004년부터 2011년까지 국내 DB오류율은 4.4%이다. 공공DB의 데이터 오류율은 5.3%로 민간DB의 1.9%보다 높다.

공공 DB의 품질이 낮은 이유는 다수 공공기관이 정보시스템이나 DB 구축은 의욕적으로 추진하지만 구축 이후 운영 과정에서 당장 드러나지 않는 데이터 품질에 대해서는 상대적으로 소홀하기 때문이다.

2011년 데이터 품질관리 성숙수준 조사에서도 국내 품질관리 성숙수준은 1.1레벨로 도입단계의 걸음마 수준이다. 데이터 품질관리 성숙수준은 조직의 데이터 품질관리 발전 단계를 고려해 `도입·정형화·통합화·정량화·최적화`의 5단계로 성숙 단계를 구분한 것으로 1.1레벨은 도입 초기에 해당한다.

공공부문의 품질관리 성숙 수준은 0.9레벨로 품질관리 도입 전 단계보다 낮은 수준이다. 각 지표별로 분석해 볼 때 보안성은 높은 수준이나 이를 제외한 정확성·유용성·적시성·접근성에 대한 수준은 매우 떨어진다. 공공정보를 민간에 제공하는 국가차원의 노력에도 불구하고 제공되는 공공정보 품질은 보장되지 못한 실정이다. 국가 차원에서 품질을 포함한 포괄적인 데이터 관리 지침과 법제도가 미비하기 때문이다.

미국은 연방정부 정보의 품질 확보를 위해 2000년 `데이터 품질법(Data Quality Act)`을 제정, 미국 연방정부의 각 산하기관과 배포대상 기관에게 품질 가이드라인 수립과 이행을 권고하고 있다. 국내는 한국DB진흥원이 2004년도부터 DB 품질진단 개선 지원 사업과 지침 및 가이드라인 보급 사업을 수행하고 있다.

◇데이터 오류로 경제적 손실 등 피해 발생=데이터 오류로 인해 발생되는 피해는 매우 크다. 2008년 전 세계를 경제 위기로 몰고 간 미국발 글로벌 금융위기도 데이터 오류로 발생한 대표적 사례다. 앨런 그린스펀 전 미연방준비제도이사회(FRB)의장은 글로벌 금융위기의 원인 중 하나로 `부정확한 데이터`를 꼽았다. 당시 글로벌 금융기관들은 최첨단 슈퍼컴퓨터로 무장한 위험예측시스템을 운영하고 있었으며 이를 통해 정부규제 없이 위험관리가 가능하리라 믿었다. 그러나 입력되는 원천데이터가 잘못돼 제대로 위험을 예측하고 관리할 수 없었다.

2009년 미국 최신예 순양함인 포트로얄호가 호놀룰루 앞바다에 좌초됐다. 미 해군 안전국의 발표에 의하면 항법시스템의 오류를 추정 원인으로 제시했다. 비행기나 선박에는 자동항법시스템이 있다. 시스템에 입력된 좌표 데이터에 오류가 있다면 어떠한 일이 발생할 것인가. 말할 나위 없이 잘못된 위치를 향해하거나 비행해 대형 사고가 발생할 가능성이 있다.

연초 국내 공립 초등(일반)학교 교사 임용시험과 관련, 합격자들의 운명이 뒤바뀐 충격적인 사건이 발생했다. 해당 교육청은 발표일 오전에 최종합격자를 공고했으나 불합격한 수험생의 성적 확인 요청에 따라 성적을 확인하는 과정에서 입력 상 오류가 있었다. 성적입력을 담당한 직원 실수로 채점번호와 시험실을 역순으로 기재한 것이 사고 원인이었다. 이 과정에서 응시인원 450명 중 152명의 성적이 잘못 입력됐다. 결국 최종합격자 315명 중 10명의 합격자가 성적입력 오류로 당락이 뒤바뀌는 웃지 못 할 소동이 벌어졌다.

◇데이터 품질관리, 조직문화로 확산=경기 불황과 침체로 IT업계 전반에 많은 변화의 바람이 불고 있다. 기업 및 기관 IT 예산은 점차 줄어들고 있다. 반면에 빅데이터 시대의 도래와 스마트 기기의 확산으로 IT인프라 변화로 정보 비즈니스 요구는 지속적으로 늘고 있다. 이러한 시기에 기업은 급변하는 환경 및 시장 조건에 대한 적응력과 대처 능력이 주된 성공요인이다.

현대 정보사회에 있어 데이터는 기업 비즈니스의 주요 핵심 자산이다. 그러나 데이터를 제대로 관리하지 않으면 부정적 요인이 발생할 수 있다는 가능성은 공감하지만, 데이터의 효율적 관리를 위해 비용과 노력을 투자하지는 못하고 있다. 실제 오류데이터로 인한 피해 사례가 발생하기 전까지는 무감각하다.

데이터 품질관리는 조직 문화로 확산하고 제도화해 이끌어 가는 것이 매우 중요하다. 데이터 오류 개선은 일회성이 아닌 꾸준한 관리가 필요하다. 부족한 데이터베이스 품질 인식을 개선시키고 표준화된 관리체계 방법을 제공하기 위해 문화체육관광부는 지난 2010년 `데이터베이스 품질인증 제도 운영지침`을 고시했다. 올해 데이터 보안 인증 등의 내용을 포함해 개정·고시했다.

데이터 인증으로 데이터 관리 체계를 조직 문화로 확산하고, 제도화 할 수 있는 기반을 마련할 수 있다. 인증 획득 과정으로 체계적인 데이터 품질 관리 틀을 마련하고 인증 결과로 데이터 품질 수준을 객관적인 기준으로 인정받을 수 있다. 인증 유지 활동과 차기 목표 수준의 도약을 위한 상시 품질관리 활동이 가능해 상시 데이터 품질관리 체계 기반을 마련할 수 있다.

한국DB진흥원은 데이터 인증심사로 한국감정원, 한국과학기술정보연구원, 건강보험심사평가원, 한국연구재단, 산림청, 한국수자원공사, 서울시, 한국문화관광연구원, 정보통신산업진흥원, 윕스 등 데이터 관리 우수 기관과 기업에게 데이터 인증을 부여했다.

신혜권기자 hkshin@etnews.com