고려대, 인공지능(AI) 모델 경진 국제대회 BioASQ에서 우승

발행일 : 2019-10-02 14:02 업데이트 : 2019-10-02 14:02

Photo Image — (왼쪽부터) 윤원진 고려대 박사과정, 요르요스 팔루오라 BioASQ조직위원, 정민별 고려대 석사과정이 BioASQ 시상식에서 기념촬영을 하고 있다.

고려대는 컴퓨터학과 연구팀이 의학, 생물학 질문에 답하는 인공지능(AI) 모델 경진 국제대회 BioASQ 대회에서 우승했다고 2일 밝혔다.

고려대 연구팀은 구글팀과 전년도 우승팀 푸단대를 제치고 우승했다. 연구팀은 윤원진, 이진혁, 김동현, 정민별 등 대학원생과 강재우 지도교수로 구성됐다.

올해로 7번째를 맞는 BioASQ 대회는 가장 오래된 의·생명 분야 질의응답 시스템 경진대회로 구글, 미국 국립보건원(NIH), 유럽연합 등이 후원했다.

이 연구팀이 참여한 BioASQ 7b Phase B챌린지는 주어진 논문에서 질문에 대한 답을 찾아내는 문제로 구성된다. 가령 대장암에 관련된 논문을 주고 “대장암의 재발에 관여하는 유전자변이는 무엇인가?” 라는 질문을 하는 방식이다. 이 대회의 결과는 사전에 전문가가 만들어 놓은 정답을 이용하여 평가한다.

연구팀은 인공지능 모델 BioBERT를 이용했다. BioBERT는 강재우 교수 연구팀(이진혁 박사와 윤원진 박사과정의 공동주도)과 네이버 클로바팀(김성동 연구원)의 협업으로 개발된 딥러닝 기반 'BERT (Bidirectional Encoder Representations from Transformers)' 모델의 의생명 분야 확장판이다.

이 모델은 문장에서의 문맥을 통하여 단어의 의미를 이해하도록 설계됐다. 1800만 건의 의·생명분야 학술논문을 학습하여 전문지식을 요하는 논문의 이해에 필요한 단어의 문맥적 정보를 습득한다. 모델은 이 정보를 바탕으로 의생명 분야 질문에 관한 답을 주어진 논문으로부터 찾는다.

BioBERT논문은 1월말 인터넷 공개 이후 현재까지 8개월간 40회 이상의 피인용 횟수를 기록하고 있다. 이는 공식 게재 전 피인용 횟수로는 매우 이례적인 수치다. 고려대는 구글, 카네기 멜론대등 해외 유수의 인공지능 연구기관들이 BioBERT논문을 인용하는 등 학계의 관심도 뜨겁다고 밝혔다. 논문은 지난 1월말 인터넷에 처음 공개된 뒤 심사를 거쳐 지난 8월에 생명정보학 최고 권위지인 바이오인포매틱스(Bioinformatics)에 최종게재 확정됐다.

강재우 교수 연구팀(윤원진, 이진혁, 김동현, 정민별)은 이 모델을 BioASQ대회에 최적화한뒤 참가했고, 총 5회의 평가회차에서 Google과 전년도 우승자 푸단대를 큰 성능 폭으로 제치고 5회 모두 1등을 기록했다.

이번 연구는 의·생명 도메인의 텍스트를 학습한 결과를 바탕으로 기존 의·생명 질의응답 시스템의 성능을 유의미한 수준까지 큰 폭으로 개선했다는 점에서 의미가 있다. 앞으로 이 모델을 이용하여 임상적으로 유의미한 의사결정 지원도구를 개발할 수 있을지 기대가 모아진다.

이번 대회 결과는 학계와 구글, 글로벌 제약회사 등 산업계의 많은 관심 속에서 독일 뷔르츠부르크에서 개최된 BioASQ워크숍에서 지난달 20일 발표됐다.

전지연기자 now21@etnews.com