카카오 인공지능(AI) 역량이 글로벌 학회에서 성과를 인정받고 있다.
카카오엔터프라이즈, 카카오브레인은 올 한해동안 다수 권위 있는 글로벌 학회에 총 26건 AI 관련 논문을 등재했다고 밝혔다.
12월, 자연어처리와 언어학을 대표하는 국제 학회 'COLING'에 카카오와 카카오엔터프라이즈는 고려대학교, 한신대학교와 공동 연구한 논문 1건을 등재했다. 기존 텍스트 요약 모델 성능을 측정하는 기준인 'ROUGE' 대신 새로운 평가 기준 'RDASS' 효용성을 연구한 결과물이다. 공동 연구팀은 향후 기계가 생성한 요약문의 참 또는 거짓을 판단하는 요소를 반영하는 연구를 진행할 계획이다.
같은 달, 매년 캐나다 벤쿠버에서 개최하는 신경정보처리시스템학회 '뉴립스(NeurIPS)'에서 카카오브레인 논문 1건과 카카오엔터프라이즈의 논문 2건이 통과됐다. '뉴립스'는 인공지능, 기계학습, 뇌과학 분야에서 최상급 권위를 가진 학회다. 각 분야 선도 그룹을 포함한 우수 연구자 논문 중 30% 이내 논문을 엄선해 소개한다.
카카오브레인은 성신여대 김영훈 교수와 공동연구를 통해 새로운 데이터 증강 기법(Test-Time Augmentation)을 제안해 데이터 다양한 변형에 효과적으로 대응할 수 있다는 내용의 학술 논문을 발표했다.
카카오엔터프라이즈는 우수한 성능 음성합성 모델을 제시한 연구 결과 논문과 TTS(text-to-speech) 모델 품질 등을 연구한 논문을 등재했다. 이번 연구로 얻은 기술력과 경험을 바탕으로 E2E(end-to-end) TTS와 음성 압축, 음질 개선, 맥락에 따라 다양한 스타일의 발화 생성 등 다양한 태스크를 수행하는 오디오 합성 연구를 진행할 계획이다.
같은 달 12월 컴퓨터언어와 자연어 연합학회 'AACL-IJCNLP 2020'에 카카오브레인, 스캐터랩 공동연구팀이 논문 1건을 등재하고 한국어 자연어 처리 과제들에 적합한 토크나이제이션 전략에 대한 실험 결과 내용을 공개했다.
11월에는 카카오엔터프라이즈 컨텍스트 파트가 세계 최고 NLP 학회 중 하나인 'EMNLP 2020'에 3건 논문을 등재했다. 각각 다국어 번역 모델 아키텍처 'M2NMT'의 가치를 재발견한 연구, 자연어처리 분야 연구로 대화 맥락에 따라 최적화된 답변 경로를 추출하는 방식에 관한 자연어 처리 분야 연구, 제로샷 모델 관련 실험과 연구에 관한 것이다. 카카오브레인 역시 같은 학회에 1건 논문을 등재하고 한국어 이해를 위한 데이터셋과 한국어 이해 모델의 성능을 측정해 공개했다.
지난 10월 음성 처리 과학기술 분야의 논문을 발표하는 세계 최대 규모 학술 대회 인터스피치에서는 카카오브레인이 해당 학술 대회에서 중국어 한자를 병음으로 전환하는 새로운 데이터셋 구축에 관한 논문 1건을 등재했다.
카카오와 카카오엔터프라이즈 AI 랩 음성처리파트가 공동 연구한 논문 1건도 통과됐다. 음성합성 모델과 음소-오디오 정렬 모델을 한번에 훈련하는 아키텍처인 'JDI-T'를 제안하고 음성 합성 기술 연구의 우수성을 인정받았다.
같은 달, 카카오엔터프라이즈는 IEEE SCI 저널인 'Signal Processing Letters'에 E2E 음성인식 기술에 관한 논문을 등재했다. 카카오, 카카오엔터프라이즈, 포항공대는 공동 연구 논문 1건을 이미지 처리 국제 학회 'ICIP 2020'에 등재하는 성과를 보였다.
이 외에도 유럽의 컴퓨터 비전 대표 학회 'ECCV 2020', 컴퓨터 비전·패턴 인식 분야 논문을 발표하는 세계적 권위의 학술 대회 'CVPR 2020' 에서 총 6건의 논문이 통과됐다. 얼굴 인식과 패션 이미지 검색 등이 주제다.
카카오 관계자는 “앞으로도 지속적으로 AI 연구에 힘써 한층 발전된 기술 사례들을 공유하겠다”고 말했다.
김시소기자 siso@etnews.com