인공지능(AI)〃전자문서 전문기업 사이냅소프트(대표 전경헌)는 '사이냅 문서필터'가 AI OCR(광학문자인식)와 연동해 이미지 내 텍스트 추출 기술력을 강화했다고 15일 밝혔다. 두 솔루션의 결합으로 문서에 포함된 이미지 내 텍스트도 추출할 수 있어 사이냅 문서필터만의 차별화된 경쟁력을 갖춘 것으로 회사는 평가했다.
사이냅 문서필터는 문서에서 텍스트를 추출하는 솔루션이다. 400+ 문서 포맷의 종류를 식별하고 50+ 포맷의 문서 파일로부터 텍스트를 추출한다. 다국어 인코딩 지원, 빠른 속도와 안정성으로 검색 엔진, 메일, 보안 솔루션의 첨부파일 텍스트 필터링에 활용되고 있다.
문서필터는 네이버, 카카오 등 대형 포털 사이트에 적용될 정도로 빠르고 안정적인 텍스트 추출에 강점을 지닌 솔루션이다. 하지만 문서 내 이미지에 포함된 텍스트는 추출할 수 없는 아쉬움이 있었다.
회사는 이러한 한계를 보완하기 위해 문서필터에 AI 딥러닝 기술을 활용해 다양한 형태 이미지에 포함된 텍스트를 인식하는 '사이냅 OCR'과 연동했다. 일반 텍스트는 물론 이미지 내 텍스트까지 인식과 추출이 가능해졌다. 문서에 포함된 모든 텍스트를 완벽히 추출할 수 있게 되어 문서필터의 가치를 한 단계 끌어 올렸다.
김시연 사이냅소프트 부사장은 “기존 문서필터에서 이미지 내 텍스트 추출을 필요로 하는 고객사의 요구가 있었다”면서 “사이냅 문서필터와 사이냅 OCR의 연동으로 고객 요구를 충족해 문서필터 선두 자리를 공고히 하겠다”고 말했다.
안수민기자 smahn@etnews.com