[사이언스인미디어] 사람 목소리를 똑같이 내는 '장산범', 현실에서 가능할까

Photo Image

영화 '장산범'은 부산 일대에서 괴담 형태로 떠돌던, 사람 목소리를 따라해 사람을 홀리는 귀신을 소재로 했다.

Photo Image

도시를 떠나 부산 장산으로 이사 온 희연(염정아)네 가족. 아들을 잃었던 슬픔을 이겨내고 새 출발 하려한다. 하지만 치매에 걸린 시어머니 행동은 점점 이상해지고, 무언가에 겁을 먹고 혼자 숲 속에 숨어있는 소녀를 만난다. 이 소녀는 딸 준희의 목소리를 똑같이 흉내낸다. 소녀가 나타난 뒤 주변 사람들은 하나 둘씩 실종된다.

그렇다면 현실에선 동일한 목소리를 내는 일은 어떨까. 결론은 '불가능하다' 이다. 말투의 특성을 따라하는 성대모사와 달리 성문(목소리)은 사람마다 다르기 때문이다.

목소리는 단순히 성대에서만 나오는 게 아니다. 성대와 성도, 식도 그리고 뇌의 후두개, 연구개를 거쳐 혀를 통과해 만들어진다. 이렇게 내는 소리를 시각적으로 그린 게 성문이다.

성문 분야 개척자인 로렌스 커스타는 1962년 목소리 무늬인 성문이 지문처럼 사람마다 다르다는 것을 발견하고 이를 기초로 화자(話者) 식별법을 개발했다. 2차 세계대전 때 미군이 적 무전병 목소리를 분석하려고 시작했던 프로젝트 성과였다.

Photo Image

오사마 빈 라덴과 사담 후세인 육성 테이프가 방영됐을 때도 성문 분석으로 본인임을 확인할 수 있었다. 미국에서 출간된 흐루쇼프 회고록의 녹음 테이프 진위 논란 또한 유엔총회 연설음과 비교 결과 진본으로 판정됐다.

과거 이슬람국가(IS) 복면 군인의 미국 기자 참수 동영상이 공개된 지 이틀 만에 미·영 정보당국이 “범인은 런던 동부 또는 남부 출신”이라고 밝혀낸 것도 이 덕분이다. 동영상 속의 사막이 어느 지역인지도 모르는 상황에서 얼굴 없는 범인의 정체를 성문으로 찾아낼 수 있는 것이다.

성문 분석과 활용 기술은 날로 발전하고 있다. 성문 분석으로 성별과 연령대는 물론 변조된 음성도 복원할 수 있다. 성문 분석 결과가 틀릴 확률은 10만분의 1에 불과하다.

국내에서는 1987년 국립과학수사연구소가 이를 도입해 이듬해부터 유괴사건 등을 해결했다. 대검찰청은 납치·유괴 등 목소리가 유일한 단서일 때를 대비해 '음성 식별을 위한 데이터베이스'를 구축하고 있다.

전화 금융사기인 보이스피싱 범인 검거에도 중요한 역할을 하고 있다.

금감원은 국립과학수사연구원과 함께 개발한 성문 분석법에는 인공지능인 머신 러닝 기법을 적용했다. 많은 양의 보이스피싱 범죄자 목소리를 단시간에 분류·분석해 수사에 도움을 주고 있다.


김지혜 기자 jihye@etnews.com


브랜드 뉴스룸