삼성SDS, "Page2HTML" SW 개발

이제 일반인들도 모든 인쇄물을 손쉽게 인터넷 문서형식인 HTML(Hyper Text Markup Language)로 만들 수 있게 됐다.

삼성SDS(대표 남궁석)의 정보기술연구소는 삼성전자가 개발한 OCR(Optical Character Recognition)기술을 사용하여 책, 신문 잡지와 같은 인쇄물을 자동으로 인터넷에 올릴수 있도록 해주는 소프트웨어인 「Page2HTML」 개발했다고 16일 밝혔다.

이 제품은 문서를 스캔하여 문서에 포함된 문자와 사진, 그래프 등의 흑백/컬러 이미지를 인식해 원본문서의 레이아웃을 보존한 형태로 인터넷용 표준문서 형식인 HTML 파일로 만들어 주며 한글과 영문을 인식할 수 있도록 설계돼 있다.

특히 기존에는 문서를 HTML 형식으로 바꾸기 위해 문자인식 소프트웨어와 글눈, 아르미 등의 인터넷 문서편집 소프트웨어가 필요했지만 「Page2HTML」은 문서 인식부터 HTML 파일까지 전과정을 자동처리한다.

현재 「Page2HTML」의 베타 버전은 삼성SDS의 홈페이지(http://www.sds.samsung.co.kr)를 통해서 무료 배포 중인데 향후 도서관, 서점, 출판사, 신문사 등에서 인터넷에 자료를 저장할 때 일일이 타이핑을 하거나 그림을 오려서 스캔받는 작업을 자동으로 처리해줌으로써 인건비 절약 등 생산성 제고에 기여할 것으로 기대되고 있다.

<김경묵기자>

브랜드 뉴스룸