특허청이 미국 특허공보에 대한 한글번역문데이터를 국내·외 특허데이터 개방 플랫폼 '키프리스플러스(KIPRISPlus)'를 통해 민간에 무료 개방한다.
이번에 개방하는 데이터는 미국 특허청이 1974년부터 2022년 10월까지 발간한 특허공개공보와 등록공보에 대한 한글번역문 총 1480만건이다.
개방된 데이터를 활용하면 국민과 기업이 영어로 된 방대한 미국 특허공보를 한글로 쉽게 검색해 볼 수 있고, 가치평가 등 특허분석에 활용할 수 있다. 또 지식재산 관련 기업은 미국 특허데이터를 활용한 서비스를 개발, 새로운 부가가치 창출이 가능하다.
특허청은 2021년 자체 개발한 인공지능(AI) 영한 번역시스템을 활용해 데이터를 구축했다. AI가 특허 분야 어려운 전문용어와 문장구조를 잘 이해해 번역할 수 있도록 특허공보와 심사·심판 문서 등에서 데이터를 구축·학습시켜 번역품질을 개선했다.
데이터 개방은 지난해 유럽 특허공보 한글번역문 데이터(500만건) 개방에 이은 두 번째로, 내년 AI 번역시스템을 활용해 중국 특허문헌에 대한 한글번역문 약 3800만건도 구축해 개방할 예정이다.
또 순차적으로 일한 AI 번역시스템도 개발해 약 2600만건에 달하는 일본 특허문헌에 대한 한글번역문도 구축·개방해 나갈 계획이다.
김기범 특허청 산업재산정보국장은 “누구나 전 세계 특허정보를 언어장벽 없이 한글로 쉽고 편리하게 검색해 활용할 수 있도록 노력할 것”이라며 “앞으로 AI 번역시스템을 더욱 발전시켜 개방하는 데이터 범위와 품질도 지속적으로 높여 나가겠다”고 말했다.
양승민 기자 sm104y@etnews.com