인공지능 및 DX 전문 기업 파워젠(대표 이정규)은 자사가 출시한 AI 기반의 'Gen OCR 3.0'이 실제 산업현장, 사무업무에 높은 효율을 제공하는 것으로 나타나 고객들의 호평을 받고 있다고 밝혔다.
지난해 출시한 파워젠의 AI 기반 Gen OCR은 RPA와 콜래보레이션을 가장 잘 이루는 솔루션으로써 바로 다양한 비정형 이미지 문서에서 필요 정보를 추출해 자동화 업무에 신속하게 대응한다. 특히 문서 분류 처리 시간 단축을 위해 해당 문서 전체의 분류를 최적화할 수 있는 영역의 최소 부분을 이미지 비교 영역으로 지정하고 지정된 영역의 대표 문서와 처리 문서의 이미지를 비교해 일정 유사도를 보이면 같은 문서로 OCR 처리하고, 안 되는 것은 Not Processed로 재학습 처리하는 등 신개념 방식의 대표 문서 기반 기계 학습 기능을 도입해 타제품과 차별화했다.
또한 지정된 영역의 특정 String을 Neural String Find 모델을 사용(String 비교를 빠르게 하기 위함) True Keyword, False Keyword를 활용하여 문서 분류를 한다. 이렇게 하면 사람이 볼 때 유사한 문서가 여러 원인으로 OCR한테 다른 문서로 오 인식되는 문제를 최소화시켜 대그룹 단위로 묶을 수 있고 적은 문서 양으로도 학습이 가능해져 구현 이후 학습 효율성이 크게 향상된다. 즉 주민등록증, 운전면허나 여권이 하나의 신분증 유형으로 통합 관리할 수 있는 것이다.
그뿐만 아니라, 학습한 문서를 바탕으로 문서 유사도 및 Keyword에 의한 자동 문서 분류가 가능하고 싱글 필드 단위, 테이블 형태의 라인별 정보 추출을 모두 할 수 있으며 판독한 결과는 RPA 처리를 위한 파일 형태와 내재된 API를 통해 타 시스템과 직접 연계가 가능하다. 병렬 처리 Middleware 엔진을 통해 대용량 문서의 신속한 OCR 처리를 하고 자동 학습 Label 기능으로 사용자의 문서 Training 노력을 최소화시킬 수 있다. Noise가 있는 문자 이미지 정보에 대해서도 Deep Learning을 통해 정확도를 높일 수 있는 기능이 내재되어 필기체 형태의 이름이나 숫자 등을 계속 학습시키면 시킬수록 정확도가 높아지도록 설계돼있다. 또한 GPU 서버 방식의 Web 시스템으로 개발되어 있어 현업 담당자별 사용 결과 접근이나 보안 및 유지보수가 용이하다.
파워젠은 FAX 등의 저 품질 문서의 자동 정위치, 찌그러짐 보정, 자동 노이즈 제거를 통한 OCR 엔진의 인식률 향상을 기할 수 있는 자동 전처리 기능과 AI Documents Classifier 기능을 탑재해 대량 페이지 문서 중 필요, 불필요 페이지를 기계 학습을 통해 필요한 페이지에서만 정보를 추출하도록 하는 차별화된 지능을 갖춰 전체 문서를 다 읽어 들이는 기존 OCR의 비효율성을 개선했다. 이로써 기존 OCR의 Full Text 처리 결과를 기반으로 Text Analysis를 통해 필요한 값만 추출해야 하는 SI 성 개발 부담을 획기적으로 줄일 수 있게 됐다.
특히, 멀티 OCR 엔진으로 기계적 교차 검증이 가능해 결과 처리에 대한 사람의 눈 검증을 90% 이상 절감도 할 수 있는 특장점도 가지고 있다. 문서 유형 또는 문서 필드별로 값을 잘 읽는 OCR 엔진을 지정 할 수 있어 하나의 OCR 엔진에 종속되는 문제도 해결할 수 있다.
최근 제조업체인 A 기업과 금융권의 B 기업들은 기존 OCR이 인식하지 못하는 고객 특화 문서와 문서 영역들을 파워젠의 Gen OCR이 높은 성능의 인식률을 보여줌으로써 자사의 업무 자동화에 대한 기술적인 고민을 해결해 주었다고 하며 파워젠의 노고에 감사를 표하기도 했다.
파워젠의 이정규 대표이사는 " 최근 저희 Gen OCR에 대한 고객들의 신뢰와 응원에 깊은 감사를 드린다"라며, "OCR은 제조현장의 문서, 하드카피나 팩스로 온 문서, 일반 OCR로 인식하기 어려운 상태의 문서, 모바일 카메라로 찍은 문서 등을 정확히 인식하여 RPA를 통해 자동으로 업무가 흘러가도록 환경을 구축함으로써 기존 OCR 솔루션보다 월등한 업무효율을 제공하여 실제 업무 현장에 맞는 OCR을 구축해 고객의 디지털 전환 구현에 앞장서 나가겠다 "라고 밝혔다.
전자신문인터넷 유은정 기자 (judy6956@etnews.com)