<시리즈> 북한의 "정보처리" 현주소 (5);코드시스템

북한의 정보처리용 한글부호계(코드시스템)는 대체적으로 2바이트체계가 가장 많이 사용되지만 편의에 따라 1바이트 체계 등이 함께 혼용되고 있다.

2바이트체계는 다시 완성형과 조합형으로 나눠지는데 기술적 한계 때문에전반적으로 완성형을 선호하고 있는 추세다. 소리마디 방식을 적용하는 2바 이트 완성형의 경우 한국처럼 언어학적.경험적.통계학적 측면에서 취급 또는사용빈도수가 높은 완성형 4천1백60자를 미리 제시해놓고 있다. (한국의 경우 제1문자세트 2천3백자、 제2확장문자세트 1천9백30자 등 모두 4천2백80 자) 2바이트완성형 환경에서 한자처리는 기본코드체계에서 제외돼 있으나 장차 코드 절환방식을 통해 남한의 2배에 상당하는 8천8백36자를 사용하겠다는 방침이다. 그러나 북한 학자 상당수는 2바이트 조합형코드체계에 대한 연구 필요성을 인정하고 있는 것으로 알려지고 있다. 또 국제표준화기구(ISO)가 추진하고 있는 ISO 10646(일명 유니코드)에도 조합형방식이 채택되기를 희망하는 것으로 전해지고 있다.

지난 9월 중국 연길에서 열린 "95코리아컴퓨터처리 국제학술대회에서 주목 받은 조선콤퓨터쎈터 실장 김명규의 "우리글 부호계의 현 실태와 개선방향에 대한 몇가지 고찰"이라는 제목의 논문에서는 이같은 북한의 상황이 잘 드러나 있다.

이 논문에서 김명규는 2바이트완성형이 우리글의 원리를 무시한 채 일본의 가나문자나 중국의 한자구현 방식을 따른 것이라고 분명히 지적하고 있다.

따라서완성형은 이를 대체할 조합형이 실용화될 때까지만 쓰며 그 이용빈도도 점차 줄여나가야 할 것이라고 주장하고 있다.

김명규의 논문은 또 2바이트조합형이 우리글 정보처리의 완전한 해결점은 아니지만 초.중.종성 조합에 따르는 글자 조합 원리를 기본적으로 구현하고있는 부호라고 설명하고 있다. 따라서 완성형에 비해 음소의 분리가 용이하다는 장점 때문에 북한학자들 사이에서 널리 호응을 얻고 있다고 소개하고 있다. 이와 관련, 북한학자들 사이에서는 새로운 2바이트 조합형코드에 대한 연구가 다각도로 진행되고 있는데 그 설계 원리는 우리의 이른바 상용조합형과동일하다. 즉 2바이트의 부호값인 16비트 가운데 초성.중성.종성에 각각 5비 트씩을 할당하고 나머지 1비트는 식별부호로 사용한다는 것이다. <표>는 김 명규가 논문에서 소개한 2바이트조합형 코드표이다.

1바이트체계는 8비트의 코드값을 갖는 것으로서 2바이트체계를 사용할 수없는 경우에만 적용되고 있다. 실제 1바이트코드는 모든 통신망이 미국표준 정보교환용 7비트 ASCⅡ코드규격을 따른다는 점에서 호환용으로 일부 이용되고있을 뿐 정보처리 정보교환용으로서는 사실상 거의 관심밖에 있는 체계이다. 최근들어 북한에서도 첨단 정보전송장치들이 대거 도입되면서 학자들사이 에서 정보교환은 물론 정보처리를 모두 수행할 수 있는 새로운 코드를 개발 하자는 의견이 강하게 제시되고 있다. 즉 국제표준인 ISO 2022에 준거하면서 우리글을 완전히 처리할 수 있고 정보처리와 교환 모두를 실현할 수 있는 새로운 1바이트/2바이트 공용체계코드를 제정하겠다는 것이다.

한편 ISO 10646, 즉 유니코드에 대해 김명규는 논문에서 부산대 김경석교 수가 주장한 첫가끝조합형에서 몇가지를 보완하자는 차원에서 수정안을 제시 、주목되고 있다.

수정안의 골자는 첫가끝조합형 방식으로 전면 전환할 수는 없으므로 2천3 백50자의 KSC 5601을 병용하자는 것과 첫가끝을 그대로 두되 완성형자로 1만1천1백72자를 다 넣어야 한다는 내용이다. 논문에서는 또 첫가끝의 실용화를 앞당기기 위한 연구가 뒷받침돼야 하며 운용체계 수준에서의 지원과 이용률 이 높은 응용프로그램 개발이 급선무라는 의견을 내놓고 있다. 그런데 지난9 월에 있었던 스위스의 ISO회의에서는 북한이 주장한 것은 아니지만 김명규의 주장과 동일한 안이 한국측에 의해 제안돼 통과된 바 있다. <서현진 기자>


브랜드 뉴스룸