“구글은 수년 내 인간을 뛰어넘는 이미지 인식 기술을 연구 방향으로 잡았습니다. 수년 안에 인간보다 컴퓨터가 사물을 더 잘 분류하는 시기가 올 것입니다.”
닐 알드린(Neil Alldrin) 구글 리서치 박사는 22일 서울 역삼동 구글코리아에서 열린 '구글 인공지능(AI) 포럼'에서 인간보다 더 정확하게 사물을 인식하는 AI 이미지 인식 기술을 연구 중이라고 밝혔다. 알드린 박사는 화상연결로 포럼에 참석, 구글 사진 관리 서비스 '구글포토'에 적용된 이미지 인식 기술과 정확도 향상 과정을 소개했다.
구글포토는 AI 방법론인 딥러닝을 도입해 정확도를 개선했다. 인간 시신경이 사물을 받아들이는 방식을 차용한 '회선신경망기술(CNN:Convolutional Neural Network)'을 적용했다. 이용자가 올린 사진 속 사물에 대한 라벨(태그 같은 키워드 정보)을 추출해 의미를 파악한다. 장소, 이벤트 등 검색어에 따라 사진을 나눠 보여준다.
사진 속 글씨, 로고, 랜드마크, 장소, 업로드 시간 등 다양한 정보를 종합·분석한다. 사진에 케이크, 촛불, '생일(birthday)' 철자 일부가 있으면 생일 이벤트로 사진을 분류한다. 크리스마스 장식이 나오고 업로드 날짜가 크리스마스 전후에 나온 사진을 크리스마스 테마로 묶는다.
이미지 인식 정확도를 높이려면 양질의 데이터를 학습시켜야 한다. 검색 데이터베이스(DB) 구축에서 확보한 방대한 이미지 데이터와 컴퓨터 비전 연구 전용 데이터셋 '오픈 이미지 데이터셋'을 활용했다. 구글, 카네기 멜론대, 코넬대가 공동 구축한 900만개가 넘는 이미지로 구성됐다. 이중 10만개는 인간이 직접 이미지 의미를 설명한 라벨링 작업을 거쳤다. 알드린 박사는 “3년 동안 구글포토가 이미지를 인식하는 데 사용하는 라벨은 25배 늘었다”고 설명했다.
향후 정확한 사물 인식을 넘어 인간이 파악하기 어려운 부분까지 인식하도록 고도화한다. 사진만 보고 어떤 장소, 사진이 찍힌 상황과 맥락을 파악한다. 고양이 사진을 보면 어떤 종인지 알려주고 스포츠카를 보면 차종과 생산년도까지 제공한다. AI가 '소가 있다'가 아닌 '소가 어떤 초원에서 풀을 뜯고 있다'까지 다양한 정보를 파악한다. 알드린 박사는 “향후 연구 방향은 초인간적 이미지 인식(Super Human Recognition)”이라면서 “일부 분야에서는 이미 인간을 뛰어 넘는 인식률을 보인다”고 강조했다.
오대석기자 ods@etnews.com