한글창제 560돌을 맞아 국어정보화를 하루빨리 세계적 수준으로 끌어올려야 한다는 목소리가 높다. 국어정보화는 대규모 국어 자료를 구축해 이를 바탕으로 컴퓨터가 언어 처리 능력을 가질 수 있게 하고, 이 기술을 자동번역·정보검색시스템 같은 언어정보산업에 응용하는 전 과정을 의미한다.
전문가들은 국어정보화가 △국어를 더욱 편리하게 사용할 수 있게 하고 △음성 인식·기계 번역 등 관련산업 발전을 초래하며 △한국어로 세계의 모든 문화 정보를 처리할 수 있는 고도의 기술을 개발할 뿐 아니라 이를 다시 세계에 전파한다는 점에서 국제 정보화 경쟁에서 한국이 주도권을 확보할 수 있는 계기가 된다고 강조한다.
정부는 이를 위해 지난 1998년부터 10년 프로젝트로 ‘21세기 세종계획’을 추진하고 있는데, 당초보다 예산이 깎이고 관련 업체들이 영세성으로 도산하는 등 원래 세운 목표를 100% 달성하기 힘들 전망이다.
◇국어 정보화의 의미와 기대 효과=컴퓨터는 인간의 말을 알아들을 수 없으므로 컴퓨터와 의사소통을 하기 위해서는 컴퓨터에 인간의 언어 규칙을 제공해 주고, 이것을 활용해 정보를 처리할 수 있는 환경까지 조성해 줘야 한다.
인간이 언어를 습득하는 것처럼 컴퓨터도 언어 지식을 습득해야 하는 것이다. 인간의 언어 처리 능력을 컴퓨터에 이식하는 과정이 바로 ‘자연 언어 처리’인데, 여기서 핵심이 되는 것이 바로 지식 베이스와 기반기술이다.
전문가들은 국어정보화의 기대 효과로 △부가가치 높은 국어정보산업 발전으로 국가 경쟁력 향상 △컴퓨터를 통해 한글로 세계의 모든 정보 입수 용이 △자력에 의한 언어 처리 기술 개발로 기술 종속 방지 △언어 처리기술 선진국 수준 도약 △세계 정보화 일익 담당 △국어 연구 기반인 언어자원 개발 및 연구방법 획기적인 발전 등을 들고 있다.
◇매머드 프로젝트 ‘21세기 세종계획’=이 같은 중요성을 인식해 정부는 지난 98년 10년 프로젝트인 ‘21세기 세종계획’을 수립, 추진중이다. 이의 목적은 크게 네 가지다. 우선 외국어로 된 정보를 우리말로 쉽게 변환해 정보처리 선진화를 이루겠다는 것이다. 또 △기계번역·음성인식 등 21세기 유망산업인 자연언어 처리 기술 개발 지원 △외국기업 공략에 대응한 한국어 처리 소프트웨어산업 보호 및 육성 △전산화된 언어 자원 확충과 활용기술 개발 등을 내세우고 있다.
유례없는 사업이다 보니 투입된 인원도 대규모다. 국어 관련 연구원(교수)과 연구보조원(석·박사급)뿐 아니라 프로그램 개발을 위한 이공계 연구원도 대거 가세해 연 300여명이 참가하고 있다. 소요 예산도 역대 최대다. 1단계(98∼2000년), 2단계(2000∼2003년), 3단계(2004∼2007년)로 나뉘어 총 186억7200만원이 책정됐다.
추진 주체인 국립국어원은 각 단계가 끝날 때마다 성과를 모아 발표하고 있는데 지난 2004년 2월에 두 번째 성과가 공개됐다. 국립국어원은 마지막 해인 내년에는 이 사업의 전체 성과에 대한 보고회를 한글날 가질 예정이다.
◇문제점도 노출=국어정보화를 세계적 수준으로 끌어올리기 위한 ‘21세기 세종계획’은 10년 장기 프로젝트이다 보니 여러 문제점이 노출됐다. 우선 예산 문제. 사업 3단계로 접어든 2004년부터 계속 예산이 깎였다. 이에 따라 당초 186여억원에서 30억원 부족한 150억원 프로젝트로 끝날 가능성이 높다. 예산이 깎인만큼 당초 계획한 연구 성과물이 나오기 힘든 것이다.
관련 산업 육성에도 빨간불이 들어왔다. 영세한 업체들이 참여하다 보니 도산하는 업체가 잇따랐다.
이상규 국립국어원장은 “21세기 세종계획 프로젝트 초기에 기계 번역 등 중소 언어정보체계 업체가 다수 활동했지만 현재는 경영난을 이유로 대다수가 사업을 포기, 국어정보화 산업 기반이 취약해졌다”면서 “대기업의 투자가 필요한 시점”이라고 밝혔다.
홍윤표 연세대 교수는 “선진국은 국어정보화를 국가 차원에서 구축·관리하고 있는 데 비해 우리나라는 아직 이를 체계적으로 관리하지 못하고 있다”면서 “중요성에 비해 국가 차원의 지원이 미흡해 미국 등 선진국과 아직 수년간의 격차가 존재한다”고 지적했다.
방은주기자@전자신문, ejbang@
관련 통계자료 다운로드 21세기 세종계획 예산