KISTI, 과학기술계 AI 생태계 구축 방안 제시

Photo Image

한국과학기술정보연구원(KISTI·원장 김재수)은 인공지능 기반 과학 및 현안 해결을 위한 과학기술 인공지능 생태계 구축 및 서비스 방안에 대한 KISTI 이슈브리프를 발간했다.

인공지능 기술은 과학기술과 산업기술의 성장과 혁신을 가속하는 핵심 기술로 대두되고 있으며, 우리나라를 포함한 세계 주요국들은 인공지능 관련 정책과 비전을 발표해 왔다.

그러나, 영국의 데이터 분석 미디어 토터스인텔리전스(Tortoise Intelligence)의 글로벌 AI지수 조사 결과, 2022년 우리나라의 인공지능 경쟁력 순위는 세계 7위를 기록했으며, 인재 부문 28위, 운영환경 부문 32위에 그쳤다.

또한, 우리나라는 AI 논문 수 세계 9위, 논문 편당 인용 수 31위, 원천기술 연구자 규모가 미국의 4%에 불과한 등 글로벌 AI 경쟁력이 열악한 것으로 분석됐다.

KISTI는 이슈 브리프에서 KISTI의 노력도 소개했다. KIST는 과학기술 분야의 AI 생태계 플랫폼인 AIDA(AI Data Archive)를 구축해 과학기술 인공지능 데이터에의 자유로운 접근과 데이터 처리, 분석 등을 지원하는 서비스를 제공하고 있다.

'AIDA'는 다양한 분야의 연구자들이 인공지능 학습 데이터를 자유롭게 활용하고 연구에 활용된 소스 코드, 모델, 분석 결과 등을 공유하여 과학 및 사회문제를 효과적으로 해결할 수 있도록 사전학습모델 기반의 맞춤형 인공지능 모델 생성 환경을 제공한다.

KISTI는 R&D 혁신과 디지털 전환 가속화를 위해 AIDA를 통해 기계 실행 가능한 링크드 데이터 서비스와 활용 인프라 구축, AI 데이터 분석·활용 워크벤치 및 코드 재현성 검증 기술개발, 문제 해결을 위한 인공지능 기반 협업 환경 등을 제공하고자 한다.

또한, KISTI는 AIDA를 통해 과학기술 기계학습 데이터셋 9종 약 3,000만 건의 데이터와 다양한 AI 연구 지원 서비스를 제공하고 있다.

AIDA는 다양한 형태의 인공지능 데이터 저장과 검색, Open API 제공, 인공지능 데이터셋의 활용 사례 등록 및 검색, 데이터 활용 신청 등 다양한 서비스를 제공한다.

특히, 국내 과학기술 논문과 특허 약 3억 8천만 문장에서 추출한 사전학습언어모델을 활용할 수 있도록 주피터랩(JupyterLab) 기반의 개발환경 인터페이스를 제공하고 있다.

AIDA의 학습데이터 레이블링 저작도구는 사전학습모델 기반 자동 레이블링 기능을 지원함으로써 학습데이터 제작의 편의성과 생산성을 향상시킨다.

KISTI 기계학습데이터연구단은 최근 AI 분야에서 화두인 멀티모달 AI에 대한 데이터셋과 기술개발을 진행할 계획이다.

다양한 유형의 정보(텍스트, 이미지, 오디오, 비디오 등)를 통하여 인간의 사고방식을 모방하는 기술인 멀티모달이 등장하고 있다.

KISTI는 과학기술 분야의 다양한 포맷에 대한 멀티모달 데이터셋 및 활용 기술을 개발하여 멀티모달 AI에 대한 수요에 대응할 예정이다.

김영준기자 kyj85@etnews.com