이파피루스가 인공지능(AI) 문서 데이터 추출 라이브러리 '파이뮤PDF 프로(PyMuPDF Pro)'를 앞세워 공공 시장 공략을 강화한다고 31일 밝혔다.
회사는 정부가 지난달 18일부터 공공기관 내 '개방형 문서 포맷(HWPX)' 사용을 전면 의무화하면서 기존 행정 시스템 내 문서를 데이터로 변환하는 수요가 늘어날 것으로 예상돼 사업을 확대할 방침이라고했다.
정부의 HWPX 의무화는 AI를 위해서다. 행정기관의 전자문서를 AI가 읽고 활용하기 쉬운 포맷으로 바꿔 AI 활용도를 높이고 행정서비스를 강화하려는 의도다.
단, 문제는 기존 문서들이다. HWP 포맷 중심으로 쌓인 기존 폐쇄형 문서들을 어떻게 유실 없이 AI가 활용할 수 있는 데이터로 전환할 지가 과제로 떠오르고 있다.
이파피루스는 '파이뮤PDF 프로'가 컴퓨팅 자원 부담이 덜한 점을 앞세워 보급에 속도를 낸다는 전략이다.
기존 솔루션들은 대다수 '독립 서버형' 구조를 채택해 고성능 CPU와 GPU, 128GB 이상 메모리를 필요로 하는 반면에 파이뮤PDF 프로는 CPU·GPU에 구애 받지 않고 4GB 이상 메모리만 있으면 돼 경량 환경에서도 작동하는 '자원 효율성'을 강조하고 있다.
또 페이지를 이미지화한 뒤 OCR(광학문자판독)로 변환하는 방식과 달리 필요한 영역만 골라내 처리하는 '하이브리드 OCR' 방식으로 문서 처리 속도를 기존 대비 50% 이상 향상시킬 수 있다는 점도 강조하고 있다.
김정희 이파피루스 대표는 “새롭게 도입되는 HWPX뿐만 아니라 기관과 기업 내에 쌓여 있는 기존 HWP 포맷 문서까지 구조화할 수 있어야 진정한 디지털 혁신이 완성될 것”이라며 “인프라 구축 부담 없이 기존 HWP와 최신 HWPX 문서를 가장 가볍고 정확하게 AI 솔루션에 수혈할 수 있는 솔루션이 될 것”이라고 말했다.
이파피루스는 파이뮤PDF 프로를 60일 동안 조건 없이 사용할 수 있는 라이선스를 무상 제공 중이다.

윤건일 기자 benyun@etnews.com



















