시중의 한 은행은 지난 5월 신용평가사에 88만건의 대출 정보 오류가 발생해 기록을 정정하겠다는 공문을 보냈다. 이 은행은 5월 4일 88만건에 대한 대출금액을 0원으로 입력하고 신용평가기관에 통보한 것이다. 이렇게 잘못된 신용정보가 입력되면서 대출 고객들의 신용등급이 상승하고 신용카드나 대출을 받지 못할 사람들이 혜택을 보게 됐다. 반면 대출이 불가능한 사람에게 자금을 집행한 금융기관들은 위험을 떠안게 됐다. 그 어떤 기관보다 안전하고 정확해야 하는 은행의 시스템에 대한 신뢰가 바닥에 떨어진 사건이다.
◇데이터 오류 사회 안전을 흔든다=이 은행의 사례는 전산 담당자의 단순한 자료 입력 실수라고 해명했지만 이런 오류를 시스템 상으로 걸러져야 한다고 전문가들은 입을 모은다.
은행은 물론 산업 현장도 마찬가지다. 자동차 생산라인에서 제품 모델명, 제작 대수, 부품 등 생산 관련 데이터 입력의 실수는 기업의 매출과 직결된다. 이는 나아가 오류 데이터를 기반으로 만들어진 자동차를 운행하는 고객의 생명까지 위협한다. A라는 차종에 맞지 않는 부품 정보를 생산라인에 잘 못 입력하고 이 부품으로 생산된 차는 어떤 결함을 초래할지 알 수 없기 때문이다.
국민 생활에 큰 영향을 끼치는 일기 예보도 마찬가지다. 관측된 기상 데이터 자체가 부정확하거나 관측점으로부터 일관되지 않고 일치하지 않는 데이터를 입수해 분석하면 아무리 좋은 예측 알고리즘과 빠른 성능의 슈퍼 컴퓨터라도 정확한 기상 예측이 어렵다.
잘 못된 원천 데이터는 조직 전체의 손실은 물론 사회 안전을 뒤흔드는 엄청난 파급 효과를 가져온다.
◇데이터가 어떤 문제를 일으키나=데이터의 문제는 여러 가지 측면에서 구분되어 질 수 있는데, 데이터의 적시성, 일관성, 정확성, 충분성 등으로 나뉜다. 적시성에 관한 문제는 일반적으로 발생하는 주소 정보의 현행화 지연으로 인한 각종 고지서 발송시 반송되는 경우에 해당한다. 신고 및 등록 주체의 자발적인 절차이행이 이뤄지지 않아 실시간으로 정보를 갱신하는데 어려움이 있다. 결국 이로 인해 행정비용이 증가하는 결과를 초래한다.
일관성에 관한 문제는 다양한 시스템간에 존재하는 동일한 종류의 데이터가 불일치 상태를 보이는 것을 말한다. 데이터의 형식과 값 모두에 대해 적용된다. 예를 들면, 법인명을 나타내는 데이터의 항목명이 이름(name), 법인(bub-in), 상호(sang-ho) 등으로 표준없이 작명되어 있거나, 데이터 속성과 크기가 개별적으로 규정되어 있는 것 등이 형식의 일관성을 가지지 못한 경우다.
A시스템과 B시스템에 등록된 고객의 전화번호, 나이, 주소지 등에 각각 상이한 데이터를 보유하고 있는 상태가 값의 일관성을 가지지 못한 사례다.
정확성에 관한 문제는 사실과 데이터가 일치하지 못하는 경우로 개별적인 오류여부에 대한 확인은 대단히 어렵다. 충분성에 관한 문제는 오류의 문제라기 보다도 의사결정에 필요한 수준의 자료 축적이 되어 있는가에 대한 것이다.
◇원천 데이터 오류를 막아라=전문가들은 데이터 오류를 막기 위해선 기업 내부 시스템에서 이를 검증할 수 있는 데이터 관리체계를 갖춰야 한다고 입을 모은다.
제대식 특허청 정보기획국장은 “성공적으로 데이터 품질관리체계를 구축하기 위해서는 전사적인 노력과 꾸준한 투자가 요구되므로, 경영진의 중요성 인식과 확고한 추진 의지를 이끌어 내는 것이 무엇보다 중요하다”고 말했다. 제 국장은 “현업 부서의 참여와 협력을 유도하기 위해 내부 규정을 마련하고 협의회를 구성하는 등 협력체계를 운영하는 것도 필요하다”며 “데이터 품질관리체계를 효율화하기 위해서는 데이터관리 전문가를 확보하고 전담조직을 구성해 데이터품질관리 활동을 자동화해야 한다”고 조언했다.
김동식 케이웨더 사장은 “데이터 관리 체계를 도입하고자 한다면, 시스템관리 · 운영 능력은 필수적인 기술이지만, 무엇보다도 그 데이터의 특성과 구조 등에 대한 전문적인 지식이 있어야 한다”고 설명했다. 김 사장은 “기상데이터의 경우 기상 데이터의 생성 주기, 데이터 수명, 데이터의 누적, 과거 자료에 대한 통계 및 통계 처리 기법 등 시스템 운영 · 관리 담당자, 기상 예보관 · 컨설턴트 등 각 분야의 전문적인 기술과 정보를 통합하기 위해서는 기상데이터에 대한 특징과 종류, 활용성 등 다각적인 검토와 관리 · 운영 방법을 논의하고 향후 데이터의 확장 및 처리 기법 적용을 위한 충분한 검증이 있어야 한다”고 덧붙였다.
김인순기자 insoon@etnews.co.kr
많이 본 뉴스
-
1
내년 '생성형 AI 검색' 시대 열린다…네이버 'AI 브리핑' 포문
-
2
5년 전 업비트서 580억 암호화폐 탈취…경찰 “북한 해킹조직 소행”
-
3
LG이노텍, 고대호 전무 등 임원 6명 인사…“사업 경쟁력 강화”
-
4
LG전자, 대대적 사업본부 재편…B2B 가시성과 확보 '드라이브'
-
5
[정유신의 핀테크 스토리]'비트코인 전략자산' 후속 전개에도 주목할 필요 있어
-
6
역대급 흡입력 가진 블랙홀 발견됐다... “이론한계보다 40배 빨라”
-
7
애플, 'LLM 시리' 선보인다… “이르면 2026년 출시 예정”
-
8
국내 SW산업 44조원으로 성장했지만…해외진출 기업은 3%
-
9
반도체 장비 매출 1위 두고 ASML vs 어플라이드 격돌
-
10
앱솔릭스, 美 상무부서 1억달러 보조금 받는다
브랜드 뉴스룸
×