[Cover Story]실시간 의사결정, 데이터 품질부터 잡아라

 업계와 기업이 비즈니스인텔리전스(BI), 데이터웨어하우스(DW)를 앞다퉈 주목하고 있는 가운데 본질적인 문제가 새로 부상하고 있다. 바로 데이터 품질 이슈다. 아무리 방대한 데이터를 다차원으로 빠르게 분석해 실시간 보고서를 내놓는다고 해도 근간 데이터의 신뢰도에 문제가 있다면 제대로 된 대응을 하기 힘들 수밖에 없다.

 최근 들어 데이터 품질관리에 대한 시각이 바뀌고 있다. 차세대시스템 프로젝트를 구축했거나 마무리 작업 중인 금융권은 데이터 품질관리를 상시 업무로 정착시키려 하고 있으며 대형 제조기업들은 글로벌 통합 환경과 기준정보관리(MDM) 구축에서 데이터 품질을 주목하고 있다. 또 행안부의 데이터 품질 제고 방침에 따라 공공기관의 데이터 품질관리 컨설팅과 솔루션 도입이 줄을 잇고 있다.

 =====

 올 하반기 차세대 시스템 구축을 마무리한 대형 금융사들은 내년 상반기부터 데이터를 활용하는 정보계 투자에 나설 것으로 전망된다. 대형 제조기업 역시 글로벌싱글인스턴스(GSI) 전사적자원관리(ERP) 시스템을 구축한 이후 글로벌 환경에서 액션 플랜을 수립하기 위한 BI 고도화에 눈을 돌리고 있다.

 공공기관 역시 공공서비스 간 정보연동이 확대되고 행안부가 공공기관의 데이터 관리 지침을 개발, 내년 상반기 배포할 예정이어서 데이터 품질관리가 시급해졌다. 행안부가 법제도 개선을 통해 공공 데이터의 품질관리 노력을 의무화시킨다는 계획이기 때문이다. 이 때문에 최근 2~3개월 간 나라장터에는 한국자산관리공사, 서울시, 한국과학기술정보연구원, 한국환경정책평가연구원 등 데이터 품질관리나 이를 포함한 EDW 사업 발주를 심심치 않게 볼 수 있다.

 유통, 통신 등 정보 기반 마케팅이 중요한 산업에서도 데이터 품질 이슈는 높아지고 있다. 11번가, CJ홈쇼핑 등 누적된 고객 데이터를 토대로 마케팅 분석을 하는 유통가에서 데이터 품질관리 솔루션과 컨설팅을 추진하고 있다. 정확한 의사결정은 정확한 데이터에서 시작한다는 생각 때문이다.

 하지만 아직 고도화된 데이터 품질관리 체계를 갖고 상시 운영하는 조직은 그리 많지 않다. 그 이유는 세 가지로 요약된다. △데이터 오류라는 곪은 살을 스스로 드러내 치료를 해야 하는 데서 오는 현업 담당자들의 거부감 △지속적인 데이터 품질 노력이 매출 향상에 가시적인 성과로 나타나지 않는 데서 경영진들의 인식 부재 △금융권 등 고수준의 데이터 신뢰도가 요구되지만 보안 이슈에 발목 잡힌 경우가 그것이다.

 ◇차세대용 1회성 데이터 품질 정제는 옛말=데이터 품질관리는 최근 들어 급부상하는 개념이 결코 아니다. 품질관리 솔루션만 놓고 보면 차세대 프로젝트를 추진한 금융권에서는 도입하지 않은 곳이 없다고 할 정도다. 시스템 이행 과정에서 데이터 이전 시 품질 체크가 필수이기 때문이다. 하지만 차세대 프로젝트에서 한시적 1회성 작업으로 수행되는 것이 일반적이었다.

 이는 차세대 개통과 함께 데이터의 오류가 늘어나는 결과를 불러왔다. 이형로 투이컨설팅 이사는 “데이터의 정확성을 일정 수준으로 유지하기 위해서는 상시적인 품질관리 업무와 프로세스가 전제돼야 한다”며 “하지만 금융권에서는 차세대 추진 시에만 반짝 수행하기 때문에 차세대 이후 데이터 신뢰도는 점점 떨어진다”고 지적했다.

 상시적인 데이터 품질관리 체계의 부재에는 경영진의 무관심도 한몫 한다. 적확하고 빠른 의사결정의 생명은 정확한 데이터에 있지만 데이터 품질이 매출과 손익으로 연결되는 가시적인 연결고리가 보이지 않기 때문이다. 오경조 지티원 이사는 “수년 동안 데이터 품질관리 노력을 해온 기업에서도 이러한 노력의 투자회수(ROI) 근거를 찾기가 어렵다”며 “단기적인 데이터 이행만으로는 검증하기는 더더욱 어렵다”고 말했다.

 더 큰 문제는 데이터에 대한 맹목적인 신뢰에 있다. 경영진이 보고서의 근간이 되는 데이터를 무조건 신뢰하는 데서 데이터 품질 문제는 시작된다. 데이터 품질관리 및 컨설팅 업계는 “최고정보책임자(CIO)나 최고경영자(CEO)가 주기적으로 데이터 품질개선에 관한 활동 내역 보고서를 챙기는가가 기업 데이터 정확도에 큰 차이를 불러온다”고 입을 모은다. 한 컨설턴트는 최고경영진이 데이터 품질에 관심을 갖고 있는 곳은 대한주택보증 1군데에 불과할 것이라고 단언하기도 했다.

 최근 들어 데이터 품질관리 솔루션 재교육을 요청한 푸르덴셜생명보험의 경우 CIO가 데이터 품질관리 보고서를 강화한 것으로 알려졌다. 차세대 프로젝트 시 데이터 품질관리 솔루션을 도입했지만 이후 활용도가 낮았지만 CIO가 데이터 품질을 직접 챙기면서 실무자들도 달라졌다는 것이다.

 ◇경영진·CIO 직접 챙겨야 품질 향상=기업 경영진의 개입은 데이터 품질관리의 전사 ‘공론화’를 뜻한다. 이는 한국DB진흥원 산하 데이터품질관리인증센터의 데이터 관리 인증 수준에서도 볼 수 있다.

 데이터품질관리인증센터의 인증 레벨은 데이터 품질관리 체계와 업무가 적용되는 조직 단위(전사/부분), 데이터의 정확도를 보는 유효성, 데이터 품질관리 체계 및 프로세스를 보는 활용성을 평가해 수여된다.

 유효성과 활용성 인증은 1~5레벨이 있으며 숫자가 높을수록 데이터 품질과 관리체계 성숙도가 높다. 3레벨 이상이 되면 데이터 품질 내역이 전사적으로 표면화되고 개선 노력과 정보가 공유되는 상황이다. 즉, 2레벨과 3레벨은 데이터 품질관리 체계가 일상적인 업무로 완전히 정착되었는지로 구분된다.

 하지만 전사 조직 차원에서 유효성과 활용성 두 부분 모두 3레벨 이상의 인증을 획득한 기업·기관은 아직 없다. 기업은행, 대한주택보증이 통합 2레벨을 획득했으며 코리아크레딧뷰로(KCB)가 유효성 3레벨, 활용성 2레벨 인증을 획득했다. 데이터 품질인증 제도가 시행된 지 얼마되지 않기도 하지만, 데이터 품질의 공론화는 현업에게 자기의 곪은 부분을 드러내고 인정하는 것과 마찬가지이기 때문에 추진 자체가 쉽지 않다.

 이 때문에 데이터 품질 제고를 위해선 경영진으로부터의 하향식 프로세스와 공론화가 필요하다. 기업은행은 데이터 품질 문제의 ‘공론화’를 위해 데이터 품질관리 프로세스를 그룹웨어와 연동했다. 품질 개선이 필요한 데이터는 그룹웨어에 공개된다. 그룹웨어에 접속해 업무를 시작하는 부서장, 팀장들에게 노출되도록 했다.

 기업은행 관계자는 “IT부서에서 데이터 품질관리를 현업에게 강제하면 오히려 거부감을 가질 수 있다”며 “품질관리 업무는 상향식과 하향식 둘 다 필요하다”고 설명했다.

 데이터 품질관리의 모범사례로 거론되는 특허청은 2008년부터 몇 차례에 걸쳐 데이터 품질관리 고도화 프로젝트를 추진했다. 그리고 IT부서의 데이터 품질개선 보고서에 근거해 해당 현업이 오류를 수정했는지 확인한다. 개선 의무를 게을리하는 현업 담당자는 인사고과(KPI) 시 불이익을 받을 수 있다.

 ◇RDB 환경에서는 품질관리 전담팀 필요=보안 역시 데이터 품질관리를 어렵게 한다. 예를 들어 고객 정보의 오류는 고객이 자의적으로 수정하거나 영업팀 등 고객과 접촉하는 부서가 고객의 동의를 얻어 수정하는 수밖에 없는데 후자의 경우 기업 내 고객 정보가 흘러다닌다는 뜻이다. CIO 입장에서는 데이터 품질보다 보안이 우선일 수밖에 없다. 한 금융권 관계자는 “내부 업무 프로세스에서 생성된 데이터의 오류는 품질관리를 수행해 해결할 수 있어도 창구에서 고객과의 접촉으로 생성된 데이터는 방법이 없다”고 토로한다.

 하지만 결국 데이터 품질관리의 해법이자 근본적인 원인은 데이터 오너십에 있다. 데이터 품질을 위해선 데이터를 생성시킨 현업에서 주도권(오너십)을 갖고 점검해야 하지만 관계형 데이터베이스(RDB)의 통합 데이터에서는 오너십이 특정 부서에게만 있지 않기 때문이다.

 예를 들어 고객번호/고객분류코드/인터넷뱅킹 가입 여부/고객등급/불량거래자료 등의 테이블을 가진 고객정보가 있다고 하자. 고객이 개인고객인지, 기업고객인지에 따라 가입심리를 하는 부서가 다르며, 고객등급은 고객관리팀(CRM팀)에서 조정한다. 또 불량거래자료는 은행연합회의 데이터다. 데이터가 통합되는 RDB의 특성 상 품질관리를 위해선 다차원의 오너십이 요구되지만 현실적으로 각 유관 부서들이 모두 데이터 품질관리 업무를 최우선순위에 두긴 어렵다.

 이를 해결하기 위해 데이터 품질관리를 전담하거나 특정 부서에 배속시켜 오너십을 공식화하는 방법이 사용된다. KCB는 데이터 품질관리 전담 조직을 두고 있으며 국민은행은 리스크관리팀이 데이터 품질관리를 책임진다. 건강보험심사평가원(심평원) 역시 데이터 품질관리 체계 고도화를 위해 컨설팅을 받고 내년 4명의 전담팀을 만들어 데이터 품질을 제고한다는 계획이다.

 품질관리 전담팀 신설, 솔루션 재교육 등은 기업의 데이터 품질관리에 대한 시각이 달라지고 있다는 뜻이다. 궁극적으로 데이터 품질관리는 다른 IT 프로젝트와 달리 ‘기업 문화를 바꾸는 프로젝트’라는 것이 전문 컨설턴트와 품질관리 이행 능력이 높은 기업들의 공통된 주장이다. 이형로 투이컨설팅 이사는 “데이터에 관한 한 이는 IT프로젝트가 아니다”라고 단언했다.

 

박현선기자 hspark@etnews.co.kr


브랜드 뉴스룸