연구데이터 공유·활용 활성화, DNA(Data·Network·AI) 저변 확대를 위한 '2021년 연구데이터·AI 분석활용 경진대회'가 오는 23일부터 30일까지 서류 접수를 받는다.
과학기술정보통신부와 국가과학기술연구회(NST)가 주최하고 '국가연구데이터플랫폼(DataON)'을 운영 중인 한국과학기술정보연구원(KISTI·원장 김재수)이 주관한다. 올해 두 번째로 열린다. 연구데이터, AI 부문으로 진행된다.
분석환경은 KISTI에서 제공되며 연구데이터 부문은 DataON에서 모든 과정을 수행해야 한다. 데이터는 DataON 데이터 및 공개된 데이터와 개인 보유 데이터를 활용할 수 있다.
이번 경진대회 AI 부문에서는 지난해 KISTI가 디지털 뉴딜 사업을 통해 구축한 과학기술 기계학습 데이터 5종 459만여 건을 공개하고 활용을 지원한다.
해당 데이터셋은 'KISTI AI 데이터 아카이브'에서 연구 목적에 한해 이용 동의 후 무료로 접근 가능하다. 향후 과학기술 논문 전문 기반 사전학습 언어모델도 10월 공개할 예정이다.
이번 경진대회는 1차 서류 평가와 최종 발표평가로 진행되며 개인이나 팀(최대 4명)으로 지원할 수 있다. 서류 접수는 DataON 공식 홈페이지를 통해 가능하다.
평가는 창의성과 우수성, 효과성을 따진다. 독창적이고 이전과 차별성을 가지는지, 내용이 구체적이고 완성도가 높은지, 결과물 실제 활용성이 높은지 등을 평가한다.
최종 발표평가는 내·외부 전문평가위원(100%)을 구성해 심사하며, 청중단 평가로 가산점을 받는 심사방법으로 진행된다.
시상은 △최우수상(부문별 1명 혹은 팀) △우수상(부문별 2명 혹은 팀) △장려상(부문별 2명 혹은 팀)으로 진행된다. 상금 규모는 총 1400만원이다. 최우수상은 상금 200만원과 과학기술정보통신부장관상, 우수상과 장려상은 각각 상금 150만원과 100만원, NST 이사장상과 KISTI원장상이 수여된다.
김재수 KISTI 원장은 “연구데이터에 관심 있는 모든 분이 마음껏 기량을 펼치고 숨은 인재들이 많이 발굴되길 바란다”며 “이런 기회를 통해 DataON이 더 많이 알려지고 국가 차원의 연구데이터 분석 및 활용에 기여할 수 있기를 바란다”고 말했다.
한편 AI 분야 대회에 쓰이도록 지원하는 과학기술 기계학습 데이터는 'KISTI 과학기술 기계학습 데이터·공유활용 시범서비스'의 일환이다. AI 기술 경쟁력 제고 및 저변 확대를 위해 과학기술 기계학습 데이터 분석 및 활용 인프라를 구축해 제공하는 것이다. KISTI AI 데이터 아카이브 뿐만 아니라, 사이언스온(ScienceOn)과 DataON에서도 검색과 접근이 가능하다.
주요 기능은 △과학기술 기계학습 데이터 등록 및 관리, 검색 조회 △데이터 활용 신청 및 오픈 API 제공 △과학기술 논문 전문 기반 사전학습 언어모델 제공 △데이터 분석·활용을 위한 DataOn 등 인프라 연계 기능 제공 등이다.
향후 분야별 기계학습 데이터, 사전학습 모델, 관련 코드, AI 모델 구축 환경 등 과학기술 AI 데이터 분석·활용 인프라 구축, 데이터·AI 기반 문제 해결 체계를 추진할 예정이다.
대전=김영준기자 kyj85@etnews.com