[Coming Up]번역메모리 기반 `CAT시스템` 뜬다

관련 통계자료 다운로드 TM 기반 CAT시스템 번역 공정

 ▲ TM기반의 CAT시스템

 급속한 글로벌화로 국가간 기술 및 정보교류가 활발해지면서 발빠른 외국 정보의 습득과 분석은 경쟁력을 강화하기 위한 필수 요소로 자리잡았다.

 이에 따라 기업은 내부, 또는 외부업체를 통해 번역작업을 수행하며 상당한 비용을 여기에 투자한다. 국내 총 번역 시장은 산업번역 1조원, 출판번역과 영상·기타 분야가 각각 5000억원으로 총 2조원에 달하는 것으로 추정된다.

 그러나 뛰어난 전문 번역가는 지극히 소수에 불과하며 번역 소프트웨어 기업들이 개발한 기계번역 솔루션들은 번역의 정확도가 떨어진다는 한계를 안고 있다.

 이같은 상황에서 최근 관련업계의 조명을 받고 있는 기술이 번역메모리(TM:Translation Memory)를 기반으로 한 통합컴퓨터지원번역(CAT:Computer Aided Translation) 시스템이다. 이 시스템은 자동 번역 기술에 휴먼 번역의 이점을 결합해 보다 정확하면서도 신속한 번역을 가능케 한다.

 TM이란 이전에 한 번 번역했던 문장을 저장하고 현재 번역할 문서와 유사한 저장 결과가 있으면 이를 자동으로 검색해준다. 즉 번역 결과를 재활용할 수 있다. 반드시 동일한 문장이 아니어도 특정 항목만 변경되는 유사 문장을 기억하고 기존 번역물과 어느 부분이 다른지 표시해준다.

 특히 산업 번역의 경우 유사한 전문용어가 반복되고 번역 물량이 방대하다는 기본적인 특성 때문에 업무 효율성을 극대화할 수 있다.

 TM을 근간으로 한 CAT시스템은 다양한 장점을 갖고 있다. 가령 CAT에 포함된 통합번역환경(ITE:Integrated Translation Environment)은 워드·HTML 문서를 그대로 불러내 가공, 저장시킨다. 만약 사용자가 복잡하게 편집된 문서를 열었다면 ITE는 단순히 텍스트만을 뽑아내 보여주고 번역가가 그 텍스트를 번역해 저장하면 결과가 다시 처음의 복잡한 편집 위치로 돌아간다.

 CAT의 프로젝트 분석 관리도구는 대규모 문서를 한꺼번에 불러들여 분석하고 내부적으로 반복되는 부분과 기존 번역 메모리가 갖고 있는 내용을 추려내 필요한 부분만을 번역하는 것이 가능하다.

 자연언어처리 기술을 활용한 용어관리 프로그램도 활용가치가 높다. 이 프로그램은 컴퓨터가 인간의 언어를 분석할 수 있도록 하는 자연언어처리 기술을 바탕으로 용어 담당자가 빈도수에 따라 전문용어로 처리할 필요가 있는 용어를 골라내 간단히 정리해주는 것만으로 용어관리가 해결된다.

 현재 국내에서는 번역 솔루션 전문기업인 클릭큐가 이같은 기술을 적용한 제품인 ‘트라비타’를 선보였으며 다수 기계번역 업체들이 제품 개발에 관심을 표명하고 있다.

 <김유경기자 yukyung@etnews.co.kr>



★관련 그래프/도표 보기