현장의 영상자료를 빠르게 입력할 수 있는 휴대폰 카메라나 디지털 카메라가 대중화되면서 카메라 문자인식 기술에 대한 요구가 증가하고 있다.
그러나 카메라로 입력된 문자 영상 처리를 위한 기술 개발은 국내·외에서 활발히 이루어지고 있으나 실용화 비율은 현저히 낮으며 국제적으로 상품화 초기 단계이다.
한국전자통신연구원(ETRI)은 최근 휴대형 디지털 카메라로 찍은 문자영상을 텍스트 정보로 변환·전송·편집하고 정보검색이나 번역, 음성서비스 등과 같은 응용 프로그램과 결합해 사용자에게 필요한 정보를 제공할 수 있는 디지털 카메라기반 문자영상 인식기술을 개발, 기술이전을 진행 중이다.
이 기술은 카메라 문자영상처리 모듈을 새로 설계, 카메라 문서 영상의 배경과 문자부분이 확연히 구분되고 주변 조명의 영향을 적게 받으면서도 실시간 화면 처리 가능한 영상 이진화를 수행할 수 있다.
또 저가형 렌즈의 왜곡을 소프트웨어적으로 보정하고 촬영 각도에 의해 발생하는 영상의 기울어짐이나 영상이 중심으로부터 바깥쪽으로 가면서 어두워지는 현상을 자동 보정시켜 준다.
한영 혼용문서에서 한글, 영어, 숫자, 특수기호의 구조적인 특징정보를 이용해 분할, 또는 결합할 블록을 정해 개별 문자를 분할하는 기능으로 인식률을 개선했다. 또 문자의 크기 및 형태 변화에 무관한 특징을 추출하기 위해 정규화과정을 거친 후 통계적·구조적인 방법을 이용해 문자 특징을 추출할 수 있는 장점이 있다.
신경망을 이용한 문자유형분류 및 유형별 문자인식기를 구현, 오인식률도 줄였다.
디지털 카메라 문서영상인식 응용 서비스 분야 및 휴대폰 카메라 및 PDA 카메라 문서 영상 응용 서비스 분야 등에 활용이 가능할 것으로 내다보고 있으며 상용화까지는 4개월 정도 소요될 것으로 예상된다.
ETRI 기술이전팀 (042) 860-5906
관련 통계자료 다운로드 다지털카메라 기반 분자영상인식 기술 개념도