[약자동행, 서울형 R&D]〈9〉퓨렌스, AI로 음성데이터 속 개인정보도 안전 관리

서울형 R&D 지원사업은 서울시가 서울의 경제를 활성화하고, 기업의 성장 동력을 창출하기 위해 진행하고 있는 사업이다. 2005년부터 지금까지 대학, 연구기관, 중소기업 등을 대상으로 약 8000억 원의 예산을 투자했다. 2018년부터는 4차 산업혁명 대응을 위한 기술 개발과 사업화에 주안점을 두고 인공지능(AI), 바이오 등 혁신 기술 개발을 중점 지원하고 있다. 본지에서는 서울형 R&D 지원사업을 통해 성과를 내는 약자 동행 기술을 소개한다.

퓨렌스는 인공지능(AI) 기반 음성데이터 솔루션 전문 기업이다. 전화상담센터를 중심으로 다양한 음성 관련 SW 개발과 솔루션 구축 사업을 벌여왔다. 이를 통해 축적한 음성데이터 분야 전문성을 활용해 △AI 음성 화자 분리 △음성 데이터 내 개인정보 비식별화 서비스 등을 선보이고 있다.

퓨렌스가 개발한 AI 음성 화자 분리는 목소리 인식과 분류 정확성 측면에서 기존 음성인식 솔루션과 명확한 차이를 보여준다. 정확한 음성데이터의 텍스트 전환과 명확한 화자 구분으로 전화상담 내용은 물론 음성 회의록 등을 보다 빠르게 정리·요약할 수 있다. 목소리 톤과 주면 소리 환경에 따른 화자 인식 오류도 적다.

단순히 화자를 구분하는 것을 넘어 목소리의 주인이 누구인지도 인식할 수 있다. 화자의 목소리를 몇초간만 학습하면 누가 어떤 이야기를 했는지 분류할 수 있다. 화자1·화자2로 정리되던 음성회의록 텍스트가 이00 과장, 김00 대리로 정리되는 셈이다. 음성회의록을 정리하는 과정에서 화자의 이름을 하나하나 수정할 필요가 없다.

Photo Image
음성 데이터 개인정보 마스킹 솔루션 관리 화면

최근에는 개인정보 등 음성데이터 속의 민감정보를 찾아 삭제하는 기술도 개발했다. 음성데이터를 텍스트로 바꿔 내용을 파악하고 텍스트 데이터상의 개인정보 및 민감정보 부분을 찾아 해당 구역의 음성에 비프음 처리 등을 하는 방식이다. 그동안 이미지와 텍스트 중심의 개인정보 비식별화가 음성데이터 영역까지 확장된 셈이다.

누구나 한 번쯤은 금융 및 의료 관련 전화상담에서 주민번호나 주소 등을 말한 적이 있다. 퓨렌스의 음성데이터 개인정보 삭제 기술이 확대되면 녹취 상황에서 음성을 통한 개인정보 노출 부담을 줄일 것으로 기대된다. 보이스피싱, 스미싱 등 정보통신 관련 범죄 수법이 고도화하는 상황에서 이 같은 기술의 등장은 반길만하다.

퓨렌스는 AI 음성 기술 개발에 있어 전화상담센터 비즈니스에서 다년간 쌓아온 노하우를 강조한다. 음성데이터 개인정보 비식별화와 관련해선 △AI를 이용한 콜센터의 녹음파일 중 개인정보 마스킹 시스템 및 방법 △마스킹 처리된 음성 개인정보를 복구하는 시스템 및 방법의 두 가지 특허를 출원한 상태다. 음성데이터의 개인정보 비식별화는 물론 이를 원본으로 다시 복원할 수 있는 기술도 확보했다.

몇몇 그룹 계열사와 도입 작업이 추진 중이다. 대기업이 사내 보안이 필요한 데이터를 저장하는 내부 클라우드에 솔루션을 적용하며 구독형 비즈니스를 진행할 계획이다.

신현삼 퓨렌스 대표는 “전화상담솔루션 시장은 계속 위축되고 있다. 성장을 위해서는 변화가 필요하다”라며 “기존 녹취와 콜센터 구축을 넘어 혁신을 통해 음성 기술 분야 새로운 시장이 열릴 것”으로 기대했다.


조정형 기자 jenie@etnews.com