“에이아이스튜디오는 비전문가도 손쉽게 '데이터 라벨링'(인공지능이 데이터를 인식할 수 있도록 재가공하는 작업)을 수행할 수 있도록 개방형 솔루션을 개발했습니다. 인공지능(AI) 학습용 데이터가 필요한 기업이 양질의 데이터를 확보하는 데 일조하겠습니다.”
에이아이스튜디오는 AI 솔루션 전문 기업이다. 개방형 크라우드소싱 플랫폼 '마이크라우드'를 통해 AI 데이터가 필요한 기업에 고품질의 데이터셋을 제공한다.
노성운 대표는 16일 “자체 개발한 데이터 가공 플랫폼 마이크라우드는 공급 기업이 더욱 효율적이고 편리하게 가공 작업을 할 수 있도록 서비스를 제공하는 솔루션”이라면서 “정부 데이터바우처 지원 사업에 선정된 공급 기업에 업무 효율을 크게 높여 주고 있다”고 말했다.
AI 알고리즘의 정확도는 데이터가 좌우한다. 문제는 데이터를 학습 가능한 형태로 가공하려면 많은 노동력과 시간이 소요된다. 한 예로 AI에 자율주행 학습을 위한 데이터를 제공하려면 무엇이 자동차고 사람인지 구분해야 한다. 이때 자동차 테두리에 일일이 점을 찍어 영역을 설정한 뒤 해당 객체가 승용차인지 버스인지 일일이 설명을 달아 주는 라벨링 작업이 필요하다.
마이크라우드는 이 같은 데이터 가공에 필요한 모든 프로세스를 원스톱으로 제공한다. 특히 자동 분할(오토 세그멘테이션) 기능인 '매직핀' 서비스를 탑재, 데이터 전 처리(어노테이션) 작업을 자동화했다.
이를 활용하면 일반 작업보다 작업 속도가 10배 이상 빨라 작업 시간을 크게 줄여 준다. 또 미리 학습한 사물 식별이 아니라 영역 내에 존재하는 사물 식별 기술로 정교한 인식률이 가능, 양질의 학습용 데이터를 얻을 수 있다.
노 대표는 “사진, 영상 등 비정형 데이터 내 배경과 오브젝트를 구분하는 작업을 자동화, 편의성과 정확성을 높였다”면서 “공급 기업 입장에선 1인당 작업량이 늘어나기 때문에 인건비도 절감할 수 있다”고 설명했다.
특히 정부 데이터바우처 지원 사업의 일환으로 라벨링 작업에 필요한 각종 툴과 포맷, 스트럭처 등 모든 프로세스를 개방형으로 제공함으로써 학생이나 주부·직장인 등 누구나 쉽게 작업에 참여해서 수익을 얻을 수 있다.
에이아이스튜디오 마이크라우드는 2억건 이상의 데이터 처리 능력을 보유했으며, 국내와 베트남 데이터센터를 통해 연간 5000만건이 넘는 데이터를 가공하고 있다. 올해 연 매출은 15억원에 이를 것으로 전망된다. 내년에는 두 배 늘어난 30억원이 목표다.
노 대표는 “오는 2023년에는 글로벌 데이터 라벨링 시장 규모가 10억달러에 이를 것”이라면서 “국내 역시 정부의 데이터 뉴딜 정책과 빅데이터 산업 성장에 힘입어 시장 규모가 대폭 확장될 수 있다”고 말했다.
박준호기자 junho@etnews.com