인공지능(AI)은 자율주행 등의 4차산업 기술 중 하나로, 모든 영역에서 발전 중이다. 클라우드 기반의 데이터로 인공지능 기술을 포괄적으로 발전시키는 해외와 달리, 후발주자인 국내는 다양한 분야에서 수집된 데이터를 중심으로 점진적인 발전 속도를 보이고 있다.

Photo Image
사진=게티이미지뱅크 제공

AI와 그를 뒷받침할 데이터산업. 국내에서는 어떤 흐름으로 이어지고 있을까? 엔터테인&에서는 데이터산업의 형태와 속도를 기준으로 국내 AI 산업 발전상을 엿보고자 한다. 과거 국내 AI 기술은 일대일 단어 대응 구조의 초기 알고리즘과 함께 인공지능의 고도화 기본인 '딥러닝(Deep Learning)' 인프라 등이 부족하다는 점 때문에 단순한 데이터 검색 대응 정도로만 펼쳐졌다.

Photo Image
사진=게티이미지뱅크 제공

하지만 패턴은 조금씩 바뀌고 있다. 국내외적인 클라우드 인프라와 함께 정부의 4차산업 경쟁력 강화 지원에 따라 대기업 일각은 물론 유망기술 스타트업이 개발에 뛰어들면서 인공지능 알고리즘의 수준은 급속도로 발전되고 있다. 여기에 알고리즘에 맞는 데이터수집과 분석 작업도 고도화되는 모양새다. 지적능력이나 신체가 성인으로 성장하면서 시기별 기초지식이 필요하듯, 고도화된 인공지능도 구동 가능한 인프라 외에 이를 뒷받침할 학습데이터가 절실히 필요한 탓이다.

Photo Image

최근 개최된 글로벌 AI 콘퍼런스 'AI SUMMIT 서울'에서 김대영 크라우드웍스 COO는 'Deep Learning 발전의 숨은 영웅들:High Quality Data Annotators' 주제발표를 통해 “AI 학습을 위해서는 인간의 힘이 중요하다”고 강조했던 바도 이와 같다.

Photo Image
사진=크라우드웍스 공식페이지 캡처

실제로 국내에서는 AI 학습데이터를 위한 작업이 다수 이어지고 있다. 이 가운데 스타트업 크라우드웍스(대표 박민우)는 관련분야는 물론 인공지능 업계 전반에서 두각을 나타내며 다각적인 협력과 벤치마킹 대상이 되고 있다. 크라우드웍스는 아마존의 Amazon Mechanical Turk(AMT)와 피규어 에잇(Figure Eight, 구 Crowd Flower), Mighty AI 등 플랫폼을 적용한 크라우드소싱 기반 AI 데이터수집·분석을 보다 섬세하게 발전시키며 주목받고 있다.

Photo Image
사진=크라우드웍스 제공

특히 2000년대 초반 AI 창업경험을 지닌 박민우 대표를 필두로 주요 기술인재의 노하우와 특허기술을 결집한 플랫폼, 크라우드 소싱을 통해 이미지·텍스트·음성·동영상 등 데이터 전반을 수집하며 AI와 인간의 선순환 관계를 주목하고 있다. 이와 함께 인력과 시스템으로 구축된 검수자동화 기능을 토대로 AI 고도화를 위한 정제된 데이터를 보다 빠르고 정확하게 산출하면서 주목받고 있다.

Photo Image
사진=크라우드웍스 제공

크라우드웍스는 대기업·연구기관·스타트업 등 80여 기업과 협업 속에서 AI 데이터 전 분야에 걸친 500여개 프로젝트를 통해 3만여 작업자들과 교류하고 있다. 이를 토대로 3300만 건 이상의 정제된 데이터를 수집 분석하며 각 분야 인공지능 업력을 높이고 있다. 실제 크라우드웍스의 AI 데이터는 네이버 파파고나 클로바, 카카오미니, SKT 누구(NUGU), 삼성전자 빅스비 등 일련의 인공지능 앱은 물론, 금융권 비대면 채널, O2O플랫폼 등에서 보이는 맞춤형 서비스로 연결되고 있다.

크라우드웍스의 정제화된 AI데이터의 수급과 수요흐름은 곧 인공지능을 기반으로 한 4차산업 주요기술과 관련 산업 활성화로 이어진다. 실제 크라우드웍스가 수집 정제한 AI데이터는 차내 음성인식·도로객체인식 등 자율주행 데이터부터, X레이사진·의학용어·태아 및 신생아사진 등의 의료, 손톱·얼굴 등 AR피팅, 동영상 어절추출 등 패션 엔터테인먼트, 일본어 OCR·동물 홍채인식 등 다방면에 걸쳐있다.

Photo Image
사진=크라우드웍스 제공

이는 네이버·카카오·삼성전자·KT 등 대기업과 ETRI·KAIST·POSTECH 등 연구기관, 스타트업 등 IT기술영역의 기업뿐만 아니라 AI 기반 서비스를 고려 중인 기업들이 크라우드웍스와의 협업을 준비하고 있는 것으로 알려졌다. 회사는 9월 한국투자파트너스, HB인베스트먼트 등 투자사들로부터 100억원 규모 투자금을 유치해 관련업계로 부터 관심을 받고 있다.

Photo Image
빅데이터 거버넌스 주요 기능 및 리파지터리 구성. (자료=한국데이터진흥원 백서 발췌)

크라우드웍스 사례에서 보듯 국내 AI데이터 시장은 실질 사용자인 대중과 AI기술의 접점을 더욱 확대함과 동시에, 자율주행·가상현실(VR)·증강현실(AR) 등 여타 4차산업 기술은 물론 전통적인 산업군 융·복합 발전을 유도하며 세계적으로 후발주자인 국내 인공지능 기술을 빠르게 고도화할 수 있도록 이끄는 견인차로서 역할을 하고 있다.

인공지능 업계 관계자는 "과거 대기업을 중심으로 연구되던 국내 인공지능 기술은 IT인프라의 확보와 4차산업 강조에 따라 스타트업까지 확대되며 시스템 고도화에 대한 기술수요를 어느 정도 충족시키는 모습을 띤다”면서 “이제는 기술 자체의 고도화 못지 않게 이를 실제 산업군에 맞게 서비스를 구현하는 것이 중요한 만큼, 인공지능 딥러닝에 필요한 데이터 범위와 정제도 수준 등이 더욱 강조되는 모양새”라고 말했다.

Photo Image
사진=게티이미지뱅크 제공

그는 또 “세계적으로는 후발주자라 할 수 있는 국내 AI 기술의 지속 발전과 함께, 여타 4차산업 기술과 협력을 위해 전반적인 성장과 데이터의 필요성은 더욱 커질 것으로 예상된다”고 말했다.

박동선 전자신문엔터테인먼트 기자 dspark@rpm9.com