문서입력장치로 스캐너가 각광 받은지는 오래됐지만 그 이용분야에서 한글문서만큼은 예외였다. 스캐너가 한글문서를 읽어들일수 있는 광학식문자인식 OCR SW가 없었기 때문이다.
영문인식SW의경우 미국에서는 이미 개발, 상용화돼 있지만 한글은 글자수가 많은데다 상호간 문자유사성이 높아 인식SW의 개발이 쉽지 않았다.
물론OCR기술 그자체가 신경망과 같은 인공지능 범주에 속하는 첨단분야이긴 하다.최근 경북대 패턴인식연구실이 개발하고 삼홍시스템이 국내처음 상품화 한 "뉴로OCR 2.0"이 높이 평가받는 이유도 그때문이다.
이제품의주된 기능은 인쇄,복사,팩스문서 등을 스캐너로 읽어들인 다음 문자 그림 도표등을 자동분리하여 인식할수 있다는 것. 또 한영혼용문, 다양한 크기의 문자와 글꼴,특수문자 등을 읽어들이고 이를 다시 워드프로세서로 불러 편집할수 있다.
"뉴로OCR"가문자를 인식하는 원리는 복잡하다.스캐너가 전자빔을 이용 하여 각종 문서를 읽어들이면 "뉴로OCR"는 이를 일단 그림(.pc.파일)형태로 컴퓨터에 저장한다.그리고 나서 "뉴로OCR"는 문서에서 진짜 그림과 문자를 분리하는 문자인식작업을 수행한다.
이때인식된 문자는 다시 워드프로세서로 불러들일수 있도록 아스키문자 (.t .t파일)로 변환된다.이과정에서 특히 인식할수 없는 부분은 공란으로 처리함으로써 워드프로세서로 수정 보완할수도 있다.
따라서 대량의 문서나 서적을 컴퓨터에 저장할때 많은 인력과 시간, 경비가 소요됐던 기존 키보드작업이 거의 필요없게 된다.이같은 사실은 관공서,도서 관,대학같은 대규모 데이터베이스작업이 필요한 곳에서는 "혁명" 과 같은 것으로 받아들여지고 있기도 하다.
엄청난잠재수요가 예상되는 이제품은 그럼에도 불구하고 "뉴로OCR2.0"은 아직 완벽한 문자인식SW라고 하기에는 부족한 점이 없지 않다.우선 우리나라 문서나 서적 등에서 빼놓을수 없는 한자의 인식이 불가능하다는 점이다.
또저장하거나 인식할수 있는 그림데이터가 ".pc."파일 뿐이라는 것도 단점 이 아닐수 없다.보다 사용이 편리하고 보편화될수 있는 윈도즈버전에 대한 기대도 만만치 않은 것같다.
물론이같은 불만은 여타 SW에 대한 그것들과는 사뭇 다른 의미다.보다 새롭고 강력한 기능이 추가된 새제품 개발에 대한 독려라는 뜻이다. "뉴로OCR2.0 "에 대한 평가가 그만큼 높다는 뜻일수 있다.
SW 많이 본 뉴스
-
1
구글, 이미지 AI '나노바나나2' 출시…'프로'급 이미지 무료 이용
-
2
2조1000억 2차 'GPU 대전' 막 오른다…이달 주관사 선정 돌입
-
3
시스원, 퓨리오사AI와 공공부문 총판계약 체결…2세대 NPU 시장 진출 본격화
-
4
AI 무기화 논란에…앤트로픽·오픈AI 엇갈린 행보
-
5
“입소문 탄 학교폭력·교권 보호 AI”…인텔리콘 'AI 나눔이', 강원특별자치도교육청 전면 도입
-
6
앤트로픽, 美 국방부 '무기 등 AI 무제한 사용 요구' 거부
-
7
[제27회 공공솔루션마켓] 성공적인 공공 AX 기반으로 AI G3 도약
-
8
[ET톡] 국가AI컴퓨팅센터 '교착'
-
9
캐릭터 챗봇, AI생성물 표기 앞장
-
10
정보시스템감리협회, '2026년도 정기총회' 성료
브랜드 뉴스룸
×


















