이파피루스, 오픈AI에 챗GPT 학습용 PDF 문서 처리 기술 공급

Photo Image
PyMuPDF가 적용된 챗GPT 사용 예시

전자문서·데이터 기술 전문 기업 이파피루스(대표 김정희)는 미국 오픈AI의 AI 챗봇 '챗GPT'에 PDF 기술을 공급한다고 29일 밝혔다.

이번에 챗GPT에 사용된 기술은 이파피루스의 미국 자회사 아티펙스 '파이뮤(PyMu)PDF'다. 오픈AI는 챗GPT의 학습뿐만 아니라 서비스 과정에서 이뤄지는 다양한 PDF 문서 처리에 파이뮤 PDF 기술을 사용한다.

파이뮤PDF는 파이선 기반의 고급 전자문서 처리 라이브러리로, AI·빅데이터 처리에 필수적인 다양한 문서 처리 기능을 제공한다. 복잡한 문서로부터 텍스트, 이미지, 표 등 정보를 정확하게 추출해 주며, 최소한의 사전 처리만으로 AI를 위한 학습 데이터를 만들 수 있어 오픈AI를 포함한 전 세계 100여 개의 AI 기술 기업들로부터 높은 관심을 받고 있다.

용도에 따라 오픈소스와 상업용 라이선스 두 가지 모델로 제공되며, 일간 다운로드가 100만 건에 달할 정도로 글로벌 오픈소스 커뮤니티에서도 큰 인기를 끌고 있다.

전자문서 처리 기술은 최근 AI 학습·활용에 있어 그 중요성이 점점 증가하고 있으며 대규모 언어 모델(LLM) 기술 학습에도 필수적인 주요 데이터 소스로 자리매김 중이다. 이파피루스 또한 이번 협력을 통해 전 세계적으로 기술력을 인정받고 있음을 입증하며 글로벌 시장에서 약진할 것으로 예상된다.

김정희 대표는 “오픈AI 외에도 구글, 오라클, 알리바바, 세일즈포스 등 글로벌 기업에 PDF 기술을 공급하고 있다”라면서 “마이뮤PDF를 통해 글로벌 시장에서 입지를 더욱 공고히 하고 AI 분야에서의 혁신을 주도할 것”이라고 밝혔다.


안수민 기자 smahn@etnews.com


브랜드 뉴스룸