
이파피루스(대표 김정희)는 문서 데이터 추출 솔루션 '파이뮤피디에프 프로(PyMuPDF Pro) v1.0'이 조달청 디지털서비스몰에 등록됐다고 23일 밝혔다.
전국 지자체, 정부 부처, 교육기관 등 공공기관에서 온라인으로 솔루션을 구매할 수 있게 됐다고 회사 측은 설명했다.
PyMuPDF Pro는 한글, MS오피스, PDF 등 문서에서 텍스트, 이미지, 표 등 데이터를 추출(Parsing)하는 솔루션이다.
글로벌 대형언어모델(LLM)이 직접 읽지 못하는 국내 공공기관의 구형 한글(HWP/HWPX) 문서까지 정제·변환할 수 있어 인공지능(AI) 학습 및 구현에 유용하다는 게 회사 측 설명이다.
또 타사 대비 최대 10배 이상 데이터 추출 속도가 빠르고, 대용량 문서를 처리할 때도 프로그램 경량화로 중앙처리장치(CPU)와 메모리에 과부하를 주지 않는다고 덧붙였다.
김정희 이파피루스 대표는 “공공기관이 보유한 구형 hwp 문서는 단순한 보관용 자료가 아니라 국가 디지털 경쟁력을 좌우할 핵심 AI 자산”이라며 “PyMuPDF Pro는 잠들어 있는 공공 데이터를 가장 빠르고 완벽하게 깨워 AI 서비스 신뢰도 향상에 기여할 것”이라고 말했다.
윤건일 기자 benyun@etnews.com



















