국가기록물 보존 표준포맷 마련 시급

 정부가 전자정부의 기반으로 추진하는 자료관시스템 사업이 기록물 보존을 위한 표준포맷 없이 추진되고 있어 문제점으로 지적되고 있다. 다양한 포맷으로 작성된 방대한 양의 공공 전자문서를 자료관시스템의 DB에 통합해 손쉽게 열람하는 동시에 원본을 훼손할 수 없도록 표준포맷 마련이 시급하다는 주장이 제기되고 있다. 이 같은 조치가 선행되지 않으면 “현재 정부가 추진하고 있는 자료관사업은 모래밭 위에 국가도서관을 짓는 꼴”이라는 지적이다.

 ◇현황=90년대 중반 이후 문서행정 정보화바람이 불면서 공공 분야에서 하나워드·아리랑·아래아한글 등을 사용한 방대한 전자문서가 생성됐다. 이 문서는 대부분 그 자체로 보존성과 진본성을 보장할 수 없는 단순 편집기로 작성됐다. 대부분 플로피디스켓 등에 보존돼 주변 환경변화에 따른 원본훼손도 빈번했다.

 이를 해결하기 위해 정부는 국가기록물관리법과 시행령에 따라 올해 초 700개 기관에 대한 자료관시스템 구축작업을 시작했다. 이미 전체 구축대상의 10%인 70개 기관에서 이미 자료관시스템을 도입했다.

 그러나 대부분의 기관은 워드 등으로 작성된 전자문서를 ‘기록물’이 아니라 ‘파일’로 간주한 채 단지 자료관시스템의 DB에 옮겨 놓는 수준에서 그치고 있다.

 자료관구축업체의 한 관계자는 “구 문서 시스템에서 신문서 시스템으로 이관한다 해도 목록정보(색인정보)를 입력하고, 철과 건별로 재구성(편철)하는 데 그치고 있다”고 밝혔다.

 ◇문제점=구 문서 시스템에서 생성된 원본이 하나워드거나, 아리랑 초기버전인 경우 이 파일을 신 문서시스템 DB로 옮긴다고 해도 문서를 열람하기는 쉽지 않다. 이 파일을 볼 수 있는 프로그램이 쉽게 구할 수 없기 때문이다. 2003년도 이전의 구기록물의 경우 하나워드·훈민정음·아리랑·아래아한글 등 문서 생성 포맷이 각각 상이하며 여기에 외부문서·민원서류 같은 DB의 형태, MS계열의 문서, 이미지, 웹문서(HTML)까지 포함하면 포맷의 종류는 헤아리기가 힘들 정도다.

 설령 이 같은 파일을 열어볼 수 있는 프로그램이 있다고 하더라도 ‘기록물’로서 국가기록물은 원본 훼손(편집)이 불가한 형태로 서비스돼야 한다는 원칙은 지켜질 수가 없다. 결국 목록정보는 알지만 도대체 이 문서가 무엇인지 열어 볼 수 없거나, 얼마든지 재저장 및 편집·수정이 가능해 기록물을 위변조할 수 있다는 결론이다.

 ◇표준포맷 마련이 대안=기록물의 보존과 활용을 위해서는 기록물 보존과 열람은 ‘원본’과 같은 ‘진본성’을 보장하고 열람시 원본에 재저장되면 안 된다. 또 기록물 열람· 활용을 위해 다운로드시 편집이 불가능해야 한다. 이와 함께 사용자의 운용체계, 폰트 등에 구속되지 않는 포맷 지원이 필요하며 편집과 위변조 시도를 방지하는 기술도 필요하다.

 이와 같은 원칙과 기술적 전제를 바탕으로 정부는 XML을 표준포맷으로 검토·연구중이다. 또 외국 기술에 대한 종속성 문제가 있지만 PDF와 플래시(FLASH) 등도 검토하고 있다. 그러나 검토되는 XML은 유통 중심이란 문제점을 안고 있다. 또 일부 기관에서 사용하고 있는 PDF 역시 보존을 위해 폰트의 제약 등 보존용으로서 가진 많은 한계를 해결해야 한다.

 관련 전문가는 “우선적으로 이 상황의 심각성을 인식하는 것이 중요하며 특히 국가기록물이라는 점을 감안해 가장 적절한 표준포맷을 서둘러 결정, 시행해야 할 것”이라고 말했다.

윤대원기자@전자신문, yun1972@


브랜드 뉴스룸