연세대 의대·네이버 공동연구팀
딥러닝 활용...정확도 77% 수준
귀 내시경 이미지를 인공지능(AI)로 분석해 병을 진단하는 기술이 개발됐다. 기술 진단 정확도는 이비인후과 전문의와 비슷한 수준이었다.
연세대 의과대학 핵의학교실 박해정, 이비인후과학교실 최재영 교수, 차동철 네이버 헬스케어연구소 의료혁신센터장 연구팀은 딥러닝 기술을 활용해 내시경 이미지를 보며 귀 질환을 진단하는 AI를 만들고 높은 진단 정확도를 확인했다고 6일 밝혔다. 이번 연구 결과는 의료정보학 분야 국제 학술지 JMIR 의료정보학 최신호에 게재됐다.
연구팀은 딥러닝 기술을 활용, AI를 만들고 AI의 진단 정확도를 평가했다. 먼저 AI를 콘볼루션 신경망으로 학습시켜 귀 내시경 사진에서 질환을 진단할 수 있는 기술을 개발했다. 콘볼루션 신경망은 2차원 데이터 분석에 적합한 구조를 가져 이미지 분류 학습에 쓰이는 딥러닝 기술의 한 종류다. 학습에는 2013~2019년 세브란스병원 이비인후과 진료 환자 귀 내시경 이미지 약 2만3000개를 활용했다. 정상 이미지는 많지만 질병 이미지가 적어 정확한 진단을 내리는 민감도가 줄어드는 문제를 해소하고자 손실 함수 기법 등을 이용했다.
이어 AI 진단 정확도를 확인했다. 귀 내시경 이미지에서 진단할 수 있는 병을 상고실 함몰, 삼출성 중이염, 급성 중이염, 종양, 고막 천공으로 분류했다. 분류 후 300장을 두 번에 걸쳐 테스트했다. 하나의 이미지를 놓고 AI와 의사가 같은 진단을 반복하는지 재현율을 검증하고자 카파(Kappa) 통계 값을 활용했다. 값이 1에 가까울수록 재현율이 높다는 것을 의미한다.
첫 번째 검사에서는 정상과 다섯 가지 병을 동일한 양으로 배치했다. 그 결과, AI 진단 정확도는 77%로, 이비인후과 전문의들의 수준(71%)과 비슷했으며 다른 분야 전문의들의 수준(46%)보다 높았다. 카파 통계 값에서는 AI는 0.83, 전문의는 0.6, 타과 의사는 0.24를 기록했다.
두 번째 검사는 질병 발생률에 따라 사진 양을 조절했다. 발생률이 높은 질병의 사진을 많이 배치했다. AI, 전문의, 다른 진료과 전문의의 진단 정확도는 각각 82%, 73%, 44%였다. 카파 통계 값은 0.8, 0.54, 0.23였다.
박해정 교수는 “이번 연구는 의료 현장에서 의사들의 진료를 보조할 수 있는 AI의 효능을 검증한 것”이라면서 “디지털 기술을 활용해 정확한 진단과 함께 환자 편의를 높이기 위한 플랫폼 연구를 이어가겠다”고 말했다.
김시소기자 siso@etnews.com