다국어 어휘 의미망 전자사전 개발

 국내 최대 규모 자연 언어 처리용 전자 사전이 개발됐다.

 한국과학기술원 전산학과 최기선 교수 연구팀(http://ci.kaist.ac.kr)은 정보 검색 및 기계 번역을 위해 단어의 의미 관계를 망으로 엮은 ‘다국어 어휘의미망’(CoreNet·코어넷)을 개발, CD와 책 형태로 출시했다고 10일 밝혔다.

 최 교수팀이 지난 1995년부터 2004년까지 10여년에 걸쳐 개발한 코어넷은 우리말 큰 사전에 수록된 5만여개의 한국어휘를 3000여개의 개념 체계로 분류하고, 구축된 모든 어휘마다 뜻을 풀이해 놓았다.

 또 한국어의 명사와 동사, 형용사를 하나의 종합적인 개념 체계로 통일화했다.

 특히 한국어와 중국어와 일본어 등 3개 다국어를 동일한 개념 체계로 연결, 인터넷 공간에서 한국어 단어의 뜻을 국제적으로 객관화해 다른 나라 말과 연결될 수 있도록 한 것이 특징이다.

 이번 전자 사전에 대한 자세한 정보는 코어넷 홈페이지(http://corenet.kaist.ac.kr)와 KAIST 전문용어언어공학연구센터(KOTERM) 홈페이지(http://koterm.or.kr)에서 찾아볼 수 있다.

 최 교수팀은 오는 21일 건국대 새천년기념관에서 열리는 ‘한글 및 한국어정보처리학술대회’에서 코어넷 출판 기념회를 가질 예정이다.

 최기선 교수는 “지난해 일본 NTT가 코어넷의 한국어 어휘 의미망과 기본 어휘 등을 일부 기술 이전받아 다국어 검색기에 상용화할 정도로 코어넷의 기능을 인정받았다”며 “현재 한·중·일 언어 외에도 독일어와 영어판을 개발중에 있으며, 언어 이해 및 실용화 모델을 추가로 개발할 계획”이라고 말했다.

 대전=신선미기자@전자신문, smshin@


브랜드 뉴스룸