
정부가 사람 얼굴을 악의적으로 변조한 딥페이크를 막는 기술 개발을 위한 인공지능(AI) 학습용 데이터를 구축·개방한다. 수어 영상을 인식해 의사를 전달하는 AI 서비스를 개발하기 위한 수여 영상 학습 데이터를 구축한다.
과학기술정보통신부가 AI 개발에 필수인 양질 데이터를 대규모로 구축·개방하는 'AI 학습용 데이터 구축 사업' 20개 과제를 확정했다.
올해는 지난해보다 예산과 과제가 2배 늘어난 20개 과제(10개 지정공모, 10개 자유공모)를 390억 원 규모(2019년 195억 원)로 추진한다. 92개 사업자가 참여해 평균 4.6대 1 경쟁률을 기록했다.
과기정통부는 국가적·산업적 필요성 관련 △사람 감성과 문맥을 이해하는 자연어 처리분야 △자동차, 드론 등 자율주행기술 분야 △음성, 시각, 언어 등 융합 분야 등 국가적으로 산업적으로 활용가치가 높고 데이터 확보 필요성이 시급한 과제를 선정했다.
△질병진단(치매, 구강질병 등), 운동 등 헬스케어 분야 △사람 얼굴을 악의적으로 변조한 딥페이크 방지 기술 분야 △장애인의 삶을 향상 시킬 수 있는 분야 등 국민 생활을 윤택하게 하고 사회적 문제를 해결할 수 있는 과제를 선정했다.
AI 학습용 데이터를 수집하고 가공하는데 많은 인력이 필요하다.
미국, 중국 등 해외에서는 누구나 참여해 데이터를 가공할 수 있는 크라우드소싱 방식을 경쟁적으로 도입한다. 인력 부족 문제를 해결하면서 양질 데이터 확보와 일자리를 창출한다.
과기정통부는 지난해 2개 과제를 크라우드소싱 방식으로 추진했다. 올해는 모든 과제에 크라우드 소싱 방식을 적용한다. AI 학습용 데이터를 구축, 일자리를 만든다.
청년과 취업준비생, 경력단절여성, 장애인 등에게 많은 일자리가 제공되고, 데이터 가공 전문성을 쌓을 수 있는 기회가 될 것으로 기대된다.
지난해 AI 학습용 데이터 구축사업 분석결과, 일반적 데이터가공은 10억당 38.1명, 크라우드소싱 방식은 10억당 200명 일자리 창출 효과가 발생했다.
과기정통부는 추경예산을 통해 코로나19 이후 경기침체를 극복하기 위해 일자리 창출효과가 크고 AI모델 개발에 필수적인 AI 학습용 데이터 구축 사업을 확대 추진한다.
150개 종류 AI 학습용 데이터를 구축하고 AI 통합 지원 플랫폼 AI 허브에서 무료 개방한다.
과기정통부는 “이번 추경을 통해 AI 학습용 데이터 구축을 대규모로 확대·구축해 데이터 댐에 모으고, 다양한 AI 기술연구, 상용화 서비스 개발에 활용하도록 지원하겠다”면서 “양질 일자리 창출과 경제성장 새로운 원동력을 확보할 수 있을 것으로 기대한다”고 말했다.
김지선기자 river@etnews.com



















