정부, AI 기본법 맞춰 '학습용 데이터 통합 제공' 체계 구축한다

Photo Image
[사진= 게티이미지뱅크 제공]

정부가 내년 시행될 '인공지능(AI) 기본법' 제정에 맞춰 AI 학습용 데이터를 통합 제공하는 체계를 구축한다. 민간에서 활용할 데이터를 단순 개방을 넘어 유통·활용까지 원스톱 지원, '민간 주도형' 혁신 서비스 개발을 이끈다는 복안이다.

16일 ICT 업계에 따르면 과학기술정보통신부는 '데이터 통합 제공 체계 구축 방안 마련' 사업에 착수했다. 한국지능정보사회진흥원(NIA)이 사업을 전담한다.

사업은 데이터 통합 제공 체계를 구축하는 첫 단추다. 근거는 AI 기본법이다. 앞서 국회는 지난해 말 AI 기본법 제정안을 의결하고, 오는 2026년 초부터 시행할 예정이다. 이 법 제15조는 '학습용 데이터의 유통·활용을 지원하는 통합 제공 시스템을 구축·관리해야 한다'고 명시한다.

이미 정부는 AI 학습용 데이터 구축 사업을 추진하면서 구축된 데이터를 'AI 허브'를 통해 '개방'해왔다. 개방한 데이터는 833종, 약 800테라바이트(TB)에 이른다.

이를 유통, 활용까지 기능을 확대해 통합 제공하는 게 데이터 통합 제공 체계 구축 사업의 목적이다. 정부는 이를 통해 민간에서 필요로 하는 데이터 수요에 대응하고, 민간 주도형 혁신 서비스 개발을 지원할 수 있다.


NIA는 체계 구축 방안 마련을 위해 국내외 데이터 플랫폼 현황과 유사 사례, 관련 법령 등을 분석하고 시사점을 도출한다. 또한 연계할 수 있는 AI 학습용 데이터 구축·제공 사업을 조사·분석한다. 이를 토대로 체계 구축 원칙과 구현 전략을 수립할 방침이다. 도출한 시사점을 참고해서 단계별 추진 과제를 정의하고, 이행 계획 목표를 설정·수립할 계획이다.

과기정통부는 체계 구축 과정에서 AI와 머신러닝(ML)을 위한 오픈소스 커뮤니티 '허깅페이스'처럼 데이터와 AI 모델을 공유하는 기반까지 마련할 예정이다. 또한 허깅페이스의 오픈 거대언어모델(LLM) '리더보드'와 같은 기능도 제공할 방침이다.

향후 데이터 통합 제공 체계가 구축되면, 민간이 주도하는 AI 혁신 서비스 개발에 탄력이 붙을 것으로 기대된다.

과기정통부는 오는 8월까지 사업을 마무리하고 도출된 방안을 토대로 데이터 통합 제공 체계 구축을 위한 단계별 추진 과제를 수립, 구현해 나갈 계획이다.

NIA 관계자는 “단계별 실행 전략을 제시하고 이행과제별 실행 일정을 수립할 것”이라며 “3개년 발전 방안을 수립할 계획”이라고 말했다.


류태웅 기자 bigheroryu@etnews.com

브랜드 뉴스룸