사이냅소프트(대표 전경헌)는 인공지능(AI) 딥러닝 기반 광학적 문자 판독(OCR) 솔루션 '사이냅 OCR'를 출품했다.
사이냅 OCR는 AI 딥러닝 기술을 활용해 다양한 형태 이미지에 포함된 텍스트를 인식한다. 텍스트·텍스트 위치 정보와 패턴 정보를 제공한다. 로보틱프로세스자동화(RPA), DLP, 검색엔진, 웹 팩스 등 다양한 솔루션에서 활용한다.
사이냅소프트가 자체 개발한 사이냅 OCR는 한글인식이 뛰어난 AI-OCR로 '딥러닝 학습 데이터 확보 및 정제 프로세스'를 통해 인식 정확도를 지속 향상 시킨다. '딥러닝 학습 데이터 확보 및 정제 프로세스'는 AI 딥러닝에서 핵심이 되는 양질 학습데이터를 자체적으로 확보하는 기술이다.
사이냅 OCR 딥러닝 기술은 이미지 내 노이즈, 그림자, 왜곡과 학습되지 않은 글꼴로 인한 인식률 변화가 적다는 점이 특징이다. 이를 통해 간판, 책 표지 등 다양한 촬영 이미지 인식이 가능해 OCR 활용 범위를 확장한다.
자체 개발한 '텍스트 위치 기반 회전 보정 알고리즘'으로 이미지를 회전 시켜야 하는 번거로운 전처리 과정 없이도 높은 인식 정확도를 제공한다. 정규식 패턴 매칭도 지원해 주민등록번호, 여권번호 등 민감 정보를 마스킹 처리한다. 템플릿 기반 서식인식 도구는 주민등록 등·초본, 여권, 계약서, 영수증 등 다양한 서식에서 원하는 데이터를 추출한다. 이렇게 서식에서 추출한 데이터는 RPA, 보안 솔루션에 활용할 수 있다.
리눅스, 윈도 환경을 지원하는 SDK 형태로 제공해 사용자는 손쉽게 기존 시스템에 연동해 활용 할 수 있다. 사이냅 문서 필터와 연동해 문서에 포함된 이미지 내 텍스트도 추출할 수 있어 OCR의 활용성을 높인 것도 타 제품과 차별화 된 경쟁력이다.
OCR는 최근 뜨거운 관심을 받고 있는 RPA 핵심기술로 떠오른다. 한글인식률이 시장 기준에 부합하지 못한다는 것이 약점이었다. 사이냅 OCR는 한글 인식이 우수해 새롭게 RPA를 구축하거나 기구축한 고객으로부터 많은 관심을 받는다. 영수증·계약서가 활용되는 보험·금융업, 소비자에게 정확한 상품 정보를 알려줘야 하는 유통·이커머스, 다양한 서식이 오가는 물류업에서 사이냅 OCR를 유용하게 활용 할 수 있다.
회사 관계자는 “사이냅 OCR는 설치형 솔루션으로 제공되지만 앞으로 클라우드 서비스도 제공해 글로벌 시장으로 진출할 계획”이라고 말했다.
김지선기자 river@etnews.com