“과학기술 빅데이터 공유체제를 완성하려면 기술적인 차원을 뛰어넘는 사회 경제적인 요인과 정책적인 요인에서 답을 찾아야 합니다.”
성원경 KISTI 정보·소프트웨어연구센터장은 “빅데이터 관리시스템이 성공하기 위해서는 기관 간 원만한 데이터 공유가 필수적”이라며 “혼자 하겠다고 해서 되는 일이 아니다”고 말했다.
각 연구자 간, 기관 간, 정부 간 상호 협조와 지원 없이는 성공할 수 없다는 점을 강조한 말이다.
KISTI는 사실 빅데이터 시대의 도래와 중요성에 대해 다른 기관에 비해 한발 앞서 인식하고 준비에 나선 기관이다. 박영서 원장이 취임과 더불어 과학데이터 공유·활용체제 구축과 활용기술 개발을 기관의 미래선도 사업 영역으로 일찌감치 정해 놨다. 올해 기관 설립 50주년을 맞아 선포한 과학기술 세계 7대 강국 진입 비전에는 빅데이터 체제 구축이 핵심과제로 담겨있다.
성 센터장은 데이터의 중요성에 대해 재차 강조했다. 지난 1990년대 실시한 프랑스 핵실험을 예로 들었다. 당시 프랑스가 각국의 반대에도 불구하고, 핵실험을 강행했다. 이유는 시뮬레이션으로 핵실험을 진행하기 위한 데이터 일부가 부족했다는 것이다.
“융합연구를 위해 데이터 공유가 필수라고 해서 연구자에게 연구 결과를 내놓으라고 강요하면 `쓰레기 데이터`만 모일 것입니다. 대부분의 연구자들은 자신의 데이터를 자신이 관리하기 원합니다. 그러나 문제는 개인이 관리하기가 어렵다는 것입니다. 외장형 하드웨어에 데이터를 담아 책상 속 한켠에 담아놓고는 잊고 지내기 일쑤죠.”
성 센터장은 독일 경우처럼 데이터 사이트(DataCite)를 운영하면서 다른 연구자가 인용할 때마다 일종의 디지털 식별번호를 붙여줘 저널처럼 연구 과정에서 발생하는 과학데이터까지도 인용될 수 있는 사례를 대안으로 제시했다.
연구자 대부분은 자신의 연구결과를 인용 없이 활용해 다른 연구결과를 내는 것에 대해 예민하게 반응할 수밖에 없다는 것이다.
“다른 사람의 데이터를 활용한 융합연구의 성공모델이 나오기 시작하면, 데이터를 공유해야겠다는 확산의지가 드러날 것입니다.”
성 센터장은 파격적인 제안도 꺼내 놨다. 기관에서 장비 구입비 2억 원만 투입하면 빅데이터 SW 플랫폼을 모두 다 무료로 제공하겠다는 것이다. 당장이야 어렵겠지만, 모든 기관과 연구자에게 빅데이터 SW 플랫폼을 공급해야 한다는 것이 성 센터장의 소신이다.
“위성 영상 500만장을 처리하는데 72년이나 걸리지만, 빅데이터 SW 플랫폼으로 처리하면 하루나 이틀이면 족합니다. 빅데이터 SW 플랫폼을 미니 슈퍼컴퓨터 정도로 이해하면 될 것입니다.”
대전=박희범기자 hbpark@etnews.com