
데이터 생애주기를 기반으로 한 AI 학습용 데이터 품질관리 가이드라인과 구축안내서가 나왔다. AI 학습용 데이터 구축사업 참여기관 품질관리와 사업 수행 역량을 제고하는데 기여할 것으로 기대된다.
한국지능정보사회진흥원(NIA·원장 문용식)은 과학기술정보통신부(장관 최기영)가 추진하는 인공지능(AI) 학습용 데이터 구축사업 품질 확보를 위해 AI 학습용 데이터 품질관리 가이드라인 v1.0(이하 가이드라인)과 AI 학습용 데이터셋 구축안내서(이하 구축안내서)를 공개했다.
이번에 공개한 가이드라인과 구축안내서는 올해 AI 학습용 데이터 구축사업부터 적용, 구축사업 참여기관 품질관리 및 구축사업 수행 역량을 제고하는데 기여할 것으로 기대된다.
과기정통부와 NIA는 지난 2017년부터 'AI 학습용 데이터 구축사업'을 통해 약 21종 460만 건의 AI 학습용 데이터를 구축, 민간에 개방했지만 데이터 품질이 사용자가 원하는 수준에 미치지 못한다는 지적이 있었다.
NIA는 이를 해결하기 위해 데이터 생애주기를 기반으로 '계획-구축-운영-활용' 영역별 데이터 품질관리 활동을 정의한 가이드라인과 AI 학습용 데이터셋 구축안내서를 개발했다.
고윤석 NIA 지능데이터본부 본부장은 “개발된 가이드라인과 구축안내서를 올해 AI 학습용 데이터 구축사업에 적용하고, 산·학·연 전문가 및 구축사업 수행기관, 참여기관 의견을 적극 수렴해 지속적으로 보완해 나갈 예정”이라고 말했다. 이번 가이드라인과 구축안내서는 지난 5일부터 NIA 누리집 및 AI 학습용 데이터 통합 플랫폼 AI 허브를 통해 내려받을 수 있다.
정재훈기자 jhoon@etnews.com