물질 내 중요 하부 구조를 탐지해 두 물질 상호작용으로 발생하는 물리적 성질을 높은 정확도로 예측하는 '그래프 신경망 기법'이 개발됐다.
한국과학기술원(KAIST·총장 이광형)은 박찬영 산업 및 시스템공학과 교수팀이 한국화학연구원(원장 이영국)과 공동연구로 이같은 성과를 냈다고 18일 밝혔다.
그래프신경망은 그래프로 표현된 데이터 구조에서 학습하는 심층학습 기법이다.
기존 연구에서는 두 분자 쌍이 있을 때, 각 분자 내 존재하는 원자들 사이 상호 작용만을 고려해 그래프 신경망 모델을 학습했다.
연구팀은 원자뿐만 아니라 작용기와 같은 분자 내 하부구조도 분자 구조 화학적 특성을 결정하는 데 중요한 역할을 한다는 점에 착안했다.
연구팀은 이어 분자 내 중요 정보를 최대한 압축해 보존하는 '정보 병목 이론', 분자 내 어떤 하부 구조가 분자 고유한 특성을 결정 짓는데 큰 역할을 했는지 인과관계를 추론하는 '인과 추론 모형'으로 중요 하부 구조를 추론하는 기술을 개발했다.
정보 병목 현상에 기반을 둔 연구는 기존연구 대비 약물 용해도 예측에서 11% 성능 향상, 다중약물요법 부작용 예측에서 4% 정확도 향상을 이뤄냈다. 또 인과 추론 모형을 기반으로 한 연구는 약물 용해도 예측에서 17% 성능 향상, 약물 부작용 예측에서 2% 정확도 향상을 보였다.
연구팀은 정보 병목 이론 관련 내용은 기계학습 분야 최고권위 국제학술대회 '국제 기계학습학회(ICML 2023)'에서, 이달에 인과 추론 모형 기반 내용은 데이터마이닝 최고권위 국제학술 대회 '국제 데이터 마이닝 학회(KDD 2023)'에서 내달 발표할 예정이다.
이들 연구 모두 이남경 KAIST 박사과정이 1저자로 참여했고 나경석 화학연 연구원이 공동저자, 박찬영 교수가 교신저자로 참여했다.
박찬영 교수는 “제안 기술은 화학과 생명과학을 포함한 다양한 분야에서 기계학습이 새로운 물질을 발견하는 데 드는 시간과 비용을 획기적으로 단축할 수 있을 것”이라고 말했다.
김영준 기자 kyj85@etnews.com