국내 연구진이 서로 다른 분야 데이터 특성·형식을 자세하게 표현하는 기술, 언제·어디서나 정확한 데이터를 찾는 기술을 개발했다. 향후 자율·협업형 데이터 허브 구축의 길을 열었다.
한국전자통신연구원(ETRI)은 데이터 프로파일링 기술과 데이터 허브 상호운용 자동화 기술을 개발했다고 21일 밝혔다.
데이터 허브 협업을 지원하는 개방형 데이터 거버넌스 플랫폼, 데이터 카탈로그 교환 및 데이터 변화 동기화, 하이퍼 메타데이터 기반 데이터 프로파일링 기술 등이 세부기술이다.
각 분야에서 만든 데이터 형식·정보가 제각각이어서 데이터 수집, 처리, 활용 시 반복적으로 발생하는 문제들을 해결하는 것이 이번 연구 목표다. 기존 기업별 데이터 관리 방식에서 벗어나, 데이터가 공유·융합되는 개방형 데이터 생태계를 위해 하이퍼 메타데이터를 관리하는 데이터 거버넌스 플랫폼을 구축했다.
하이퍼 메타데이터는 데이터에 대한 정보를 설명하는 정보다. 데이터 종류·양이 증가함에 따라 고정 메타데이터만으로는 데이터를 정확히 파악하고 활용하기 어려워 이를 활용했다.
ETRI의 자율·협업형 데이터 허브는 거버넌스 플랫폼을 중심으로 데이터 협업 생태계를 구성한다. 하이퍼 메타데이터를 기반으로 데이터 구조, 형식, 특성, 데이터 간 관계 등 다양한 정보를 동적으로 구성한 데이터 프로파일을 교환함으로써 데이터 관리를 자동화할 수 있다.
하이퍼 메타데이터 기반 데이터 프로파일링 기술은 웹 표준을 리딩하는 국제 컨소시엄 W3C에서 제정한 기술을 기반으로 구현된 세계 최초 기술이다.
또 자율·협업형 데이터 허브 간에는 데이터 카탈로그를 교환하고 변화된 데이터 정보를 서로에게 즉시 알려주는 상호운용 기술이 구현돼 기술이 확산시 국내·외 어디서나 최신 정보를 정확하게 검색할 수 있다.
데이터 허브 간 상호운용 세션 관리 기술은 한국정보통신기술협회(TTA)에서 국내 표준으로 제정됐다. 현재 국제표준단체 국제전기통신연합(ITU) SG13에서 국제 표준화를 추진 중이다. 관련 소프트웨어(SW)는 일반에 공개할 계획이다.
원희선 ETRI 사이버브레인연구실장은 “기술 실증을 위해 여러 일자리 사이트 간에 채용 정보를 수집, 공유하고 변동이 생기는 즉시 반영해 사회적 약자를 대상으로 최적의 일자리를 추천하는 서비스를 개발했다”고 말했다.
한편 연구진은 21일 경기창조경제혁신센터 기가홀에서 자율·협업형 데이터 허브 시연회도 개최했다.
연구진은 이번 기술시연회를 통해 △데이터 거버넌스 개념 △데이터 허브 생태계 구축 △데이터 프로파일 △분산 데이터 파이프라인 등도 함께 설명하는 자리를 가졌다. 이후에는 시범서비스의 시연과 기술사업화 컨설팅 시간이 마련됐다.
김영준 기자 kyj85@etnews.com