광주과학기술원(GIST)은 오디오 지능을 연구하는 김홍국 전기전자컴퓨터공학부 교수팀이 국제전기전자공학회(IEEE) 산하 신호처리소사이어티(AASP)가 개최하는 '국제 음향 장면 및 이벤트 탐지 분류(DCASE)' 경진대회에서 '언어질의 기반 오디오 소스 분리 부문' 1위와 '실내 음향 이벤트 탐지 부문' 3위를 차지했다고 9일 밝혔다.
이번 경진대회는 2013년부터 열린 세계적인 대회로 인공지능(AI)을 이용해 소리를 듣고 상황을 판단하는 음향 인식 기술을 겨룬다. 올해는 4월 1일부터 6월 15일까지 약 3개월간 108개의 유수 기관 및 대학이 참가해 음향 장면 인식, 기계 이상 진단 확인 등 10개 분야에서 경쟁을 펼쳤다.
김 교수의 오디오지능연구실(AiTeR) 학생들로 구성된 'GIST-AunionAI' 팀(송윤아 석박통합과정생·이도현 석박통합과정생, 김홍국 교수)은 김 교수의 창업 회사인 오니온에이아이 지원을 받아 경진대회에 참가했다. 다양한 오디오 지능을 표현할 수 있는 AI 기술을 접목해 고성능 언어질의 기반 오디오 소스 분리 기술을 개발해 1위를 차지했다.
또 한화비전 연구원과 함께 구성된 GIST-한화비전팀(손상원 석사과정생·박종연 석박통합과정생·김홍국 교수, 한화비전의 노승인 상무·임정은 수석연구원·술라이만 베살 연구원)은 다양한 오디오 지능을 표현할 수 있는 AI 기술을 접목해 고성능 실내외 음향 이벤트 탐지 기술을 개발했다. 보조 분류기 기반 모델 학습 기술과 다양한 입력 특성 추출 기술 등으로 AI 모델을 개선함으로써 우수한 성과를 거뒀다.
김홍국 교수는 “이번 수상은 AI 모델이 연구실에 머물지 않고 사업화로 연계할 수 있다는 가능성을 열었다는 데 의의가 크다”며 “특히 거대언어모델(LLM) 기반 오디오 생성 및 인식 AI 모델을 지속적으로 개선하는 노력과 함께 이를 다양한 분야에 적용해 편리하고 안전한 삶을 위한 기술 발전에 기여하겠다”고 말했다.
광주=김한식 기자 hskim@etnews.com