인공지능 음성-자막변환 기술과 웨어러블 AR 스마트글라스의 만남

청각장애인 의사소통 돕는 서비스 '씨사운드', 정확도 90% 이상

Photo Image

첨단 기술을 활용해 장애인과 비장애인의 간극을 줄기 위한 노력들이 속속 이어지는 가운데 청각장애인의 의사소통을 돕는 스마트 자막안경이 시장에서 주목받고 있다.

엑스퍼트아이앤씨가 출시한 '씨사운드'는 인공지능 음성-자막 변환 기술을 AR 스마트글라스에 적용, 상대방 음성을 스마트글라스 디스플레이에 자막으로 보여주는 스마트 자막안경이다. 제품은 청각장애인의 의사소통과 정보 접근을 위해 AI 기반으로 실시간 음성-문자 변환 서비스를 제공한다. 자막안경의 마이크를 통해 입력된 발화자 대화 음성이 씨사운드 앱을 통해 클라우드 서버의 AI STT(Speech-to-Text) 엔진으로 전달돼 텍스트로 변환된다. 이를 다시 자막안경의 디스플레이에 자막으로 보여주는 구조이다. 음성-자막 변환 정확도는 90% 이상이며, 실시간 자막 표출 반응속도는 2초 이내로 높은 정확도를 자랑한다. 구글의 트랜스크라이브와 마이크로소프트의 아즈아와 비교를 해도 음성-자막 변환도 정확도가 월등하다는 게 회사 측 설명이다.

Photo Image

특히 최초로 음성-자막 변환 AI 기술을 AR 스마트글라스에 적용한 사례다. 관공서, 은행, 지하철, 회사, 가정 등 WiFi가 가능한 곳이면 언제 어디서든 사용이 가능하다. 또 스마트폰(Android)용 앱을 제공해 대화 내용을 실시간 텍스트로 저장하고 필요할 때 확인할 수 있어 회의, 강의 등 기록 보관에도 편리하다.

엑스퍼트아이엔씨 관계자는 “앞으로 90% 이상의 정확도를 95% 이상으로 높이고, 위급 상황의 소리와 자동차 경적 등의 위험 음향을 자막으로 변환하는 기능을 추가하는 등 고도화 작업도 진행 중”이라며 “API 서비스도 개시할 예정”이라고 전했다.

Photo Image

현재 씨사운드는 한국장애인고용공단의 '보조공학기기 보급사업'에 선정돼 올해부터 24년까지 3년간 청각장애인용 의사소통 보조기기로 보급하고 있다. 등록장애인은 한국장애인고용공단을 통해 씨사운드 제품을 지원 받을 수 있다.

윤대원기자 yun1972@etnews.com