본 논문은 UNIX사용자에게 펜을 이용한 보다 편리한 인터페이스를 제공 하기 위한 필기인식기술을 소개했다. 대표적인 문자인식 방법인 통계적 방법과 구조해석의 방법의 장점을 결합하기 위하여 은닉 마르코프 모델(Hidden Ma-rk ov Model)을 획정합 방법, 지식기반인식방법 및 언어모델과 자연스럽게 결합 할 수 있는 확장된 넷워크의 구조를 제안하였으며 이를 이용하여 온라인 흘림체 한글 문자를 인식하였다.
먼저은닉 마르코프 모델을 이용하여 각 자소와 자소간의 연결 획을 모델링한후 문자생성 규칙에 의하여 각 모델을 초성-연결획-중성-연결획- 종성의 순서로 연결하여 한글의 모든 문자를 표현하는 문자인식 넷워크를 구성 하였다. 제안한 넷워크는 온라인 문자의 시간적, 공간적 변형을 처리할 수 있으며 특히 흘려 쓴 문자를 인식할 수 있다. 그러나 입력특징이 단순하고 국부적이며 자소모델간 확률분포의 분산이 학습데이터의 변형정도에 따라 큰 차이를 보이기 때문에 몇가지 유형의 예상하지 못한 오인식이 나타난다.
따라서본 논문에서는 확장된 넷워크를 이용하여 전체적인 형태정보와, 유사 한 자소 또는 문자 쌍을 구분하기 위한 특성정보를 인식기에 포함시킴으로써 이러한 문제를 개선하였다.
"확장된넷워크"란 각 노드에 임의의 제약조건을 부착한 넷워크로 먼저 언어 학적 지식을 이용, 가능한 탐색경로를 예측한후 자소모델을 탐색한다. 그후 자소모델의 탐색결과로 모델과 잘 대응되는 후보 자소가 생성한 다음 구조해 석방법을 이용한 검증과정을 수행하고 유사한 자소쌍이 모두 후보에 포함되었을 경우에는 쌍구분 과정을 수행하여 하나의 자소를 선택한다.
실험결과데이터집합의 특성에 따라 94~97%의 인식률을 나타냈고 명백한 오 인식제거를 통하여 62.61%의 오인식을 감소시켰으며 탐색공간의 감소로 21 .4%의 속도를 향상시켰다. 이 결과를 통계학적으로 분석하면 99.5% 이상의신뢰도로 나타나고 있다고 할 수 있다.
SW 많이 본 뉴스
-
1
모바일 주민등록증 전국 발급 개시…디지털 신분증 시대 도약
-
2
삼성SDS, 클라우드 새 판 짠다…'누리' 프로젝트 띄워
-
3
무슬림 해킹조직, 한국 정부 사이트 디도스 공격
-
4
삼성SDS, 병무청 행정 시스템 클라우드 전환 맡는다
-
5
전문가 50명, AI기본법 개정 머리 맞댄다
-
6
오픈AI, 코어위브와 클라우드 계약…MS와 결별 가속화되나
-
7
마케터, 생성형 AI 의존 심화…사용자 신뢰 잃을라
-
8
산·학·연 모여 양자 산업 지원…NIA, 양자 클러스터 기본계획 마련 착수
-
9
[뉴스줌인]경기 침체 속 오픈소스 다시 뜬다…IT서비스 기업 속속 프로젝트 추진
-
10
유통가 개인정보 유출사고 연이어
브랜드 뉴스룸
×