네이버가 인공지능 비전(AI Vision) 기술 효율을 크게 높이는 방법을 발표했다. 기술 수준을 1년 이상 앞당길 수 있는 길을 열었다. 비전은 컴퓨터가 카메라 또는 화면을 통해 습득한 이미지와 영상을 분석하는 기술이다. 자율주행, 영상탐지추적, 광학문자판독기술(OCR) 등 AI가 쓰이는 대표 분야 중 하나다.
5일 네이버에 따르면 윤상두 네이버 클로바 연구원은 지난달 서울에서 열린 국제컴퓨터비전학회(ICCV)2019에서 '지역적 특징을 가지는 분류기 학습을 위한 학습 데이터 생성방법' 논문을 발표했다. 통상 학회에 제출한 논문 중 4%만 받는 구두 발표 기회를 받았다.
네이버는 해당 논문에서 '분류기' 기계학습 효율을 크게 높이는 방법을 제시했다. 분류기는 컴퓨터가 파악한 영상이나 이미지 내용과 형태를 정확하게 분석하는 소프트웨어다. 논문이 제시한 방법론 핵심은 기존 데이터를 활용해 학습량과 복잡도를 늘리는 것이다.
예를 들어 기존에 보유한 쿠키와 컵 이미지 일부를 결합한 후 새로운 이미지를 제시하면, 분류기가 보다 고차원 학습을 수행할 수 있도록 했다. 컴퓨터가 스스로 중첩되는 이미지를 판별하고 위치까지 파악해 낼 수 있다.
새 방법을 적용하면 분류기 이미지 판별 정확도가 76%에서 78%로 증가했다. 비전 분야에서 분류기 정확도는 1~2년 사이 2~3% 증가되는 것이 보통이다. 물리적 방법으로 정확도를 2% 향상시키려면 분류기 용량을 2~3배 늘려야 한다.
윤 연구원은 “논문은 머신러닝에 필요한 데이터와 용량, 하드웨어 인프라를 늘리지 않고도 분류기 효율을 높일 수 있다는 가설을 입증했다”면서 “이 방법을 적용하면 예산, 시간, 인력, 용량 등 투입 리소스를 늘리지 않고 분류기 수준을 끌어올릴 수 있다”고 설명했다.
네이버 비전 분야는 박사급 연구원 10여명이 활동 중이다. 국내에서 가장 많은 전문 인력을 보유했다. 인력 대부분이 30대로 최신 기술을 연구하는 '젊은 박사'가 많다.
윤 연구원은 “AI는 일 효율을 높이는 것은 물론 인간 노동력으로 해결할 수 없는 영역에 도전할 수 있는 토대가 된다”면서 “실제 서비스에 적용할 수 있는 기반 기술을 계속 연구할 것”이라고 말했다.
김시소기자 siso@etnews.com