10년 세종계획… "2억 어절 분량 말뭉치 전산화"

 국어 정보화에 대한 산업계의 관심이 높은 가운데 최장기 국어 정보화 사업의 결과물을 공유하는 자리가 마련된다.

 국립국어원(원장 이상규)은 1998년부터 올해까지 10년간 150억원의 예산을 투여한 국어 정보화 사업인 ‘21세기 세종계획’의 성과를 11일 국립중앙박물관에서 발표한다.

 이날 행사에서는 대규모 국어 자료를 축적해 정보·지식으로 가공하는 말뭉치 구축 사업 성과가 발표된다.

 작업결과 소설책 4000권 분량 약 2억어절의 말뭉치를 만들고 검색하는 전산시스템이 구축됐다.

 이날 행사에는 말뭉치와 전자사전, 방언 비교 등의 세종계획의 성과 발표 외에도 음성합성 및 음성인식 엔진 업체 코아보이스, 자동번역업체 엘엔아이소프트, 한국어 맞춤법·문법 검사기 개발 업체 나라인포테크의 시스템 시연이 예정돼 있다.

 글꼴디자인 업체인 윤디자인 연구소와 산돌커뮤니케이션은 그간 개발한 다양한 글꼴을 전시한다.

 그동안 세종계획은 △말뭉치 구축 △한국어 60만 어휘 규모의 전자사전 구축 △남북한 언어 비교 △문자코드 표준화, 글꼴 지원 등의 분야로 나눠 진행됐다.

 외국에서는 영국, 중국, 일본 등이 단어 및 어절 위주의 말뭉치 구축 사업을 국가 차원에서 수행하고 있는 상황이다.

 현재 국내 국어정보화 관련 시장은 글꼴 300억원, 검색어 1조원 규모로 해마다 성장세를 보이고 있다.  

 홍윤표 교수는 “국어정보화는 이제부터 시작이며 지금까지 구축된 자료를 활용하지 않으면 결국은 썩히게 된다”며 “국민과 정부가 관심을 가져 국어정보를 지속적으로 관리할 필요가 있다”고 말했다.

이수운기자@전자신문, pero@

브랜드 뉴스룸