한국특허정보원은 지식재산(IP) 분야에 특화된 고성능 인공지능(AI) 언어모델 'KorPatELECTRA'를 확대 보급하겠다고 밝혔다.
정보원은 지난해 AI 언어모델 KorPatBERT를 공개한 바 있다. 올해 새롭게 보급하는 KorPatELECTRA는 미국 Google에서 기존 언어모델 BERT 보다 학습 효율과 성능을 향상시키기 위해 개발한 최신 언어모델 ELECTRA를 기반으로 구축한 언어모델이다. KorPatELECTRA는 특허분야 한국어 자연어처리에 적합하도록 국내 특허문헌 약 466만건에 포함된 5억4000만 문장을 학습해 구축하였다.
기존 언어모델과의 성능 비교 결과 KorPatELECTRA는 개체명 인식과 기계독해 분야에서 뛰어난 성능을 보였으며, 이를 통해 지능형 IP정보서비스 구축 시 언어모델 선택의 폭을 넓혀 줄 수 있을 것으로 기대된다.
신규 언어모델의 상세한 구축 과정과 학술적 성과는 추가적인 연구로 확장될 수 있도록 논문발표를 통해 내용을 공유하였고, 연구의 우수성을 인정받아 관련 저널에 게재됐다.
기존 KorPatBERT 사용 협약체결 기관·기업(35곳)을 대상으로 실시한 설문조사 결과를 바탕으로 보급절차를 간소화했으며, 글로벌 오픈소스 공유 플랫폼 '깃허브'를 통해 공개해 관심 있는 기관·기업, 연구자 누구나 KorPatELECTRA를 이용할 수 있다. 다음달 1일부터 개최되는 국제특허정보박람회(PATINEX)에서 신규 언어모델과 IP분야 디지털 혁신사례 및 활용 전략 등을 공개할 예정이다.
정보원은 AI 언어모델 개발에 그치지 않고, 이를 활용한 고품질의 특허분류 추천, 유사특허검색 시스템을 구현하였으며, 현재는 특정 언어에 구애받지 않고 시스템을 활용할 수 있도록 다국어 처리 기술에 대한 실증을 진행 중이다.
강경호 원장은 “한국특허정보원 특수법인 출범과 '디지털플랫폼정부' 정책에 발맞춰 IP분야 지능정보화 혁신을 위한 AI 모델 보급 및 기술이전을 지속적으로 추진하겠다”면서 “민·관이 함께 성장하는 혁신 생태계를 조성해 지식재산 기반 기술강국으로 발돋움하는데 중추적인 역할을 수행해 나가겠다”고 밝혔다.
이준희기자 jhlee@etnews.com