[기로의 국어정보화-세종계획](상)국어대계 명맥 단절

Photo Image
지난 11일 서울 용산 국립중앙박물관에서 열린 21세기 세종계획 성과발표회에서 참석자들이 세종계획의 일환으로 만들어진 60만개의 어휘를 수록한 전자사전을 검색해 보고 있다.

 지난 1998년 닻을 올린 ‘세종계획’의 목표는 국어정보화였다. 15세기 훈민정음이 문자문맹률 0%를 목표로 했다면 이 계획은 국민들의 국어정보 문맹률 0%로 도전하자는 것. 여기엔 한민족 언어 정보화, 표준화한 전자 사전 구축, 전문 용어 표준화, 말 뭉치 구축 사업 등 일반 기업들이 하기 힘든 국어 정보화 계획이 대거 포함됐다. 일부사무관들은 IMF 사태 1년후 어려운 상황에서 자리를 내놓을 각오로 이 프로젝트를 추진했다는 후문이 들릴 정도다. 하지만 지난 11일 사업 주관기관 국립국어원이 총 150억원을 들인 10년 성과물을 발표한 이래 세종계획은 멈춰 서 있다. 세계최고의 정보화 언어이자 IT발전의 견인차인 한글정보화의 현주소는 ‘명맥이 끊길 위기’로 요약된다. 기로에 선 국어정보화의 문제와 대책을 점검해 본다.(편집자주)

*글싣는 순서

(상)국어대계 명맥 단절

(중)내팽개쳐진 정보화

(하)산업에 다가서라



 최근 네티즌과 모바일족의 미니홈피, 휴대폰 문자메시지 등에서 디지털화한 한글 글꼴이 날개 돋힌 듯 팔려나간다. 싸이월드가 제공하는 한글 글꼴은 130여종. 싸이월드 1일 매출 중 10%가 글꼴을 팔아서 벌어들인다. 한글 자연어 처리 선두주자 검색업체 네이버의 매출은 올해 1조원에 육박한다. 주가는 매일 고공행진이어서 기간통신사업자인 KT를 위협할 정도다.

 이처럼 국어 정보화는 정보검색, 글꼴부터 전자사전에 이르기까지 국어 정보화로 노다지를 캐는 산업으로 거듭나게 하는 원동력으로 시장창출 효과는 어림잡아 수조원규모다.

 올해 마무리되는 세종계획 프로젝트 결과는 전자사전 개발, 한민족 언어 정보화, 전문용어 정비, 문자코드 표준화 글꼴 개발 등 국어정보화라는 시대적 소명을 향한 성과들이 쏟아져 시장에 대한 기대감을 높이고 있다.

 일례로 언어정보 자동처리용 전자사전은 일반 전자사전에 수록된 어휘보다 5배가량 많은 60만 어휘를 자랑하는 국내 최대 전자사전이다. 2억 어절의 말뭉치는 어휘 간 관계 분석을 통해 자연어 처리, 검색 등에 두루 활용될 수 있다.

 박동인 한국정보과학기술원 책임연구원은 “세종계획 초창기에만 해도 국어정보화에 대한 개념을 이해하지 못하는 사람이 많았다”면서 “이제 취할 것과 버릴 것에 대한 큰 그림이 나왔다는 점에서 ‘절반의 성공’”이라고 평가했다.

 그렇지만 세종계획의 명맥은 추가 보완 프로젝트없이 10년 노력을 사장시킬 위기에 처해있다. 사업의 잘잘못을 가리고 활용방안을 찾아 성과를 계승 발전할 후속 검증사업 로드맵과 예산이 전무하다는 점 때문이다.

 사업성과를 공유하거나 전문가들 조차 홍보하는 방안이 전혀 없다는 점은 정책당국이 프로젝트를 띄운 의도나 상식을 의심케 할 정도다.

 검색솔루션업체 코리아와이즈넛 안영훈 기획팀장은 “세종계획에 대해서는 여러 차례 들어봤지만, 성과물 공유방안에 대해서는 들어본 바 없다”고 말했다.

 홍재성 서울대 인지과학협동과정 교수는 “말뭉치와 전자사전 구축에서 표준화 문제 등이 제기되고 있다”며 “이를 바로 해결하지 못하면, 지난 10년 간의 ‘공든탑’도 무너질 수 있다.”고 말한다.

 류현정·이수운기자@전자신문, dreamshot@

브랜드 뉴스룸