"유닉스학술대회"심퍼지엄 지상중개

본 논문은 UNIX사용자에게 펜을 이용한 보다 편리한 인터페이스를 제공 하기 위한 필기인식기술을 소개했다. 대표적인 문자인식 방법인 통계적 방법과 구조해석의 방법의 장점을 결합하기 위하여 은닉 마르코프 모델(Hidden Ma-rk ov Model)을 획정합 방법, 지식기반인식방법 및 언어모델과 자연스럽게 결합 할 수 있는 확장된 넷워크의 구조를 제안하였으며 이를 이용하여 온라인 흘림체 한글 문자를 인식하였다.

먼저은닉 마르코프 모델을 이용하여 각 자소와 자소간의 연결 획을 모델링한후 문자생성 규칙에 의하여 각 모델을 초성-연결획-중성-연결획- 종성의 순서로 연결하여 한글의 모든 문자를 표현하는 문자인식 넷워크를 구성 하였다. 제안한 넷워크는 온라인 문자의 시간적, 공간적 변형을 처리할 수 있으며 특히 흘려 쓴 문자를 인식할 수 있다. 그러나 입력특징이 단순하고 국부적이며 자소모델간 확률분포의 분산이 학습데이터의 변형정도에 따라 큰 차이를 보이기 때문에 몇가지 유형의 예상하지 못한 오인식이 나타난다.

따라서본 논문에서는 확장된 넷워크를 이용하여 전체적인 형태정보와, 유사 한 자소 또는 문자 쌍을 구분하기 위한 특성정보를 인식기에 포함시킴으로써 이러한 문제를 개선하였다.

"확장된넷워크"란 각 노드에 임의의 제약조건을 부착한 넷워크로 먼저 언어 학적 지식을 이용, 가능한 탐색경로를 예측한후 자소모델을 탐색한다. 그후 자소모델의 탐색결과로 모델과 잘 대응되는 후보 자소가 생성한 다음 구조해 석방법을 이용한 검증과정을 수행하고 유사한 자소쌍이 모두 후보에 포함되었을 경우에는 쌍구분 과정을 수행하여 하나의 자소를 선택한다.

실험결과데이터집합의 특성에 따라 94~97%의 인식률을 나타냈고 명백한 오 인식제거를 통하여 62.61%의 오인식을 감소시켰으며 탐색공간의 감소로 21 .4%의 속도를 향상시켰다. 이 결과를 통계학적으로 분석하면 99.5% 이상의신뢰도로 나타나고 있다고 할 수 있다.

브랜드 뉴스룸