사진; 한국과학기술정보연구원의 정보시스템연구실(실장 류범종·아래줄 가운데) 연구원들이 한자리에 모여 한국형 검색엔진의 상용화 의지를 다지고 있다.
‘최신 과학기술 정보의 논스톱 관리와 원스톱 서비스를 실현한다.’
한국형 검색엔진의 상용화에 온 힘을 쏟고 있는 한국과학기술정보연구원(KISTI) 정보시스템연구실(실장 류범종)이 정보서비스의 생성부터 저장·검색에 이르기까지 모든 과정을 하나의 시스템으로 통합하기 위해 내건 캐치프레이즈다.
이 연구실에서는 최근 대용량의 과학기술분야 전문정보를 빠르게 검색하고 효과적으로 관리할 수 있는 정보검색 관리시스템인 ‘크리스탈-2000’을 개발, 고가의 상용 DBMS 없이도 정보를 안전하게 관리함으로써 검색엔진분야의 변혁을 주도하고 있다.
그동안 국내에서 개발된 대용량 문헌정보서비스 시스템은 정보검색과 관리시스템의 분리로 고비용, 저효율을 초래한 것이 현실이다. 특히 정보관리시장의 경우 외국산 상용 DBMS가 장악해왔다.
이에 따라 이 연구실에서는 시스템 구조로 인해 발생하는 낭비요소를 제거하고 우리나라 실정에 맞는 정보서비스의 기반시스템을 개발하기 위해 관련 기술과 시스템 연구를 병행해왔다. 그렇게 탄생한 것이 바로 ‘크리스탈-2000’. 이 제품으로 인해 정보검색 관리시스템에 대한 기본 개념이 새로 만들어지고 있다.
이 시스템은 기존 시스템에서 나타났던 검색 성능 저하현상을 원천적으로 방지하고 XML문서나 오디오·비디오 등 다양한 데이터 관리가 가능한 것이 최대의 장점이다. 또 정보서비스에 반드시 적용돼야 할 언어처리기술과 고속·분산검색기술 등을 정보관리 기능과 융합해 성능을 크게 향상시켰다.
특히 연구진은 데이터의 변경이 자주 발생하는 소규모 정보서비스 시스템에서 수천만건 이상의 데이터를 제공하는 포털사이트용 정보서비스 시스템에 이르기까지 운용환경에 따라 소규모의 시스템 변경만을 거치면 원활한 서비스 및 관리가 가능할 것으로 내다보고 있다.
활용범위도 넓어 문헌정보시스템을 비롯해 멀티미디어 서비스, 고문서 DB편찬, 맞춤정보 서비스, 유전자 정보 등 다양한 서비스 적용이 가능하다.
앞으로 업체들이 성능 검증 없이 검색엔진을 상용화하고 있는 현실을 감안, 사용자 질의를 이해하는 고급 수준의 성능 검증을 지원할 계획이다. 또 한글 특징에 맞는 지원체계를 구축, 검증 실용화 단계까지 프로토타입으로 검색엔진을 개발할 계획도 갖고 있다.
정보검색 성능테스트를 위해 10만여건(문서분류 4만건, 교차언어검색 6만건)의 한글테스트 컬렉션을 구축하고 ‘크리스탈 2.5 버전’의 원시코드 및 전문용어 사전 공개도 준비중이다.
류범종 실장은 “시스템 기능은 데이터 구조가 다르지만 모두 지원이 가능한 멀티 스키마와 정형 및 비정형 데이터의 혼용을 지원하는 테라비트급 범용 분산저장엔진 개발이 목표”라며 “다국어 검색이 가능한 교차언어 검색지원 기능도 추가할 방침”이라고 말했다.
그는 또 “검색엔진분야의 획기적인 발전을 이루기 위해서는 추가적인 예산투입이 불가피하다”며 “좀더 나은 연구성과를 위해서 정부의 과감한 예산 지원이 필요하다”고 덧붙였다.
<대전=박희범기자 hbpark@etnews.co.kr>
경제 많이 본 뉴스
-
1
내년 '생성형 AI 검색' 시대 열린다…네이버 'AI 브리핑' 포문
-
2
5년 전 업비트서 580억 암호화폐 탈취…경찰 “북한 해킹조직 소행”
-
3
LG이노텍, 고대호 전무 등 임원 6명 인사…“사업 경쟁력 강화”
-
4
AI돌봄로봇 '효돌', 벤처창업혁신조달상품 선정...조달청 벤처나라 입점
-
5
롯데렌탈 “지분 매각 제안받았으나, 결정된 바 없다”
-
6
애플, 'LLM 시리' 선보인다… “이르면 2026년 출시 예정”
-
7
'아이폰 중 가장 얇은' 아이폰17 에어, 구매 시 고려해야 할 3가지 사항은?
-
8
美-中, “핵무기 사용 결정, AI 아닌 인간이 내려야”
-
9
삼성메디슨, 2년 연속 최대 매출 가시화…AI기업 도약 속도
-
10
美 한인갱단, '소녀상 모욕' 소말리 응징 예고...“미국 올 생각 접어”
브랜드 뉴스룸
×