
한국지능정보사회진흥원(원장 문용식, NIA)은 과학기술정보통신부가 추진하는 인공지능(AI) 학습용 데이터 구축사업 품질 확보를 위해 AI 학습용 데이터 품질관리 가이드라인 v1.0과 AI 학습용 데이터셋 구축안내서를 공개했다.
이번에 공개하는 가이드라인과 구축안내서는 2021년도 AI 학습용 데이터 구축사업부터 본격 적용한다. 구축사업 참여기관의 품질관리 및 구축사업 수행 역량을 제고하는데 기여할 것으로 기대된다.
2017년부터 과기정통부와 NIA는 'AI 학습용 데이터 구축사업'을 통해 약 21종 460만 건의 AI 학습용 데이터를 구축해 민간에 개방했다. 데이터 품질이 사용자가 원하는 수준에 미치지 못한다는 지적이 있었다.
NIA는 데이터 생애주기를 기반으로 '계획-구축-운영-활용' 영역별 데이터 품질관리 활동을 정의한 가이드라인과 AI 학습용 데이터셋 구축안내서를 개발했다.
고윤석 NIA 지능데이터본부 본부장은 “개발된 가이드라인과 구축안내서를 올해 AI 학습용 데이터 구축사업에 적용할 계획”이라면서 “산·학·연 전문가와 구축사업 수행기관, 참여기관의 의견을 적극 수렴해 지속 보완할 예정”이라고 말했다.
가이드라인과 구축안내서는 NIA 누리집과 AI 학습용 데이터 통합 플랫폼 AI 허브에서 내려받을 수 있다.
김지선기자 river@etnews.com