<열린마당>국어정보화

▲김수연 문화관광부 국어정책과장(kingsy@mct.go.kr)

일찍이 주시경 선생은 『나라를 보존하고 일으키는 일은 나라의 근본을 세우는 것이며, 그것은 자기 말과 글을 존중하여 씀에 있다』고 강조하였다. 언어는 그 민족의 혼이 담긴 「존재의 집」과 같은 것이어서 정보화시대에 영어로 된 웹사이트가 전체의 70∼80%를 차지하는 것을 볼 때 우리말과 글을 마음놓고 사용할 수 있는 자유마저 잃어버리지 않을까 하는 위기감을 느끼게 된다.

그래도 한가닥 희망을 갖는 것은 언어의 권력적 속성이 그대로 드러나는 인터넷에서 이미 다국어 번역시스템이 개발돼 언어장벽 해소의 대안으로서 가능성을 보여주고 있다는 사실이다. 21세기 지식정보사회에서는 자국어에 의한 정보의 가공·생산 기술이 그 나라의 국가 경쟁력을 좌우하게 될 것이며, 그 나라의 말을 어떻게 적응·발전시키는가 하는 문제가 곧 그 나라의 언어 및 문화의 생존과도 직결될 것이다.

선진국들은 60년대부터 언어정보화의 중요성을 인식, 대규모의 자국어 언어자원을 구축하고 이를 활용해 기계번역·정보검색 등과 같은 응용프로그램 개발에 투자를 아끼지 않았다. 이제는 자국어 정보처리에서 한 걸음 더 나아가 외국어 처리에서도 그 나라를 위협하는 수준에 이르고 있다.

이에 반해 우리나라는 80년대 후반에 이르러서야 국어정보학의 개념이 도입되고 말뭉치(corpus)라는 대규모 언어자료를 구축하기 시작했다. 현재 선진국의 자연언어처리 기술에 비하면 10여년 뒤진 것으로 평가되고 있다. 90년대에 이르러 문화관광부가 국가적 차원에서 대규모 국어기초자료를 구축하기 시작했고, 이러한 사업을 종합적인 계획으로 체계화시킨 것이 바로 「21세기 세종계획」이다.

「21세기 세종계획」, 즉 국어정보화 사업이란 쉽게 말해서 대규모의 국어자료를 구축한 후 이를 바탕으로 컴퓨터가 언어처리 능력을 가질 수 있게 하고 이 기술을 21세기 새로운 정보산업의 총아로 각광받고 있는 자동번역·음성인식시스템 등의 언어정보산업에 응용하는 전 과정을 의미한다. 「21세기 세종계획」은 이 가운데 범용성 있는 대규모의 국어자료를 구축해 언어정보산업의 획기적인 발전에 기여하고자 하는 사업이다.

요즈음 언론을 통해서 많은 정보기술 업체들이 기계번역 및 음성인식 등 국어정보화와 관련된 신제품을 출시하고 있는 것을 볼 때 앞으로 국어정보화의 앞날이 어둡지 않다는 희망을 갖게 된다. 그러나 그러한 제품들의 성능이 아직까지 만족할 만한 수준은 아니어서 성능개선의 여지가 많은 것이 사실이다. 여기에는 우리말 정보처리를 위한 대규모의 정밀한 국어자료가 충분히 제공되지 않았기 때문이다. 이러한 문제를 해결하기 위해 국가적 차원에서 말뭉치와 전자사전 등 응용프로그램 개발의 기초가 되는 국어자료를 구축하고 있는 것이다.

지난 98년부터 시작된 이 계획은 올해로 3년째를 맞이하고 있다. 그 동안 참여한 국어학·언어학·전산학 등 관련 분야 연구원들의 헌신적인 노력으로 단기간임에도 불구하고 차질없이 추진되고 있다. 2단계 사업이 시작되는 내년부터는 그 동안 축적해온 결과물들을 업계쪽에도 적극 제공해 검증·활용될 수 있도록 할 계획이다. 이것이야말로 우리말 정보처리기술의 자생력을 확보하고 국제적 경쟁력을 강화하려는 「21세기 세종계획」의 목적에도 부합되기 때문이다.

국어정보화의 성공은 21세기 지식정보화시대에 한글을 가장 적합한 문자로서 그 우수성을 세계에 알리고 문화강국의 토대를 닦는 길이요, 이것이 곧 한글을 창제하신 세종대왕의 위민정신을 새롭게 계승·발전시키는 것이다. 앞으로 국어정보화 사업이 성공하기 위해서는 정부와 업계의 노력도 중요하지만 국어정보화에 대한 인식을 제고하고 저변을 확대하는 일이 우리가 풀어야 할 시급한 과제다. 이러한 과제를 풀어가는 데 학계·언론계의 아낌없는 지원도 요구되고 있다.


브랜드 뉴스룸