세계적 동영상서비스 기업 넷플릭스는 2013년, 제작 단계부터 고객 데이터를 분석해 배우, 장르 등 맞춤형 자체 제작 드라마를 선보였다. 업계에서 처음으로 빅데이터 분석 결과를 반영해 만든 드라마가 '하우스 오브 카드'다. 하우스 오브 카드가 세계에서 성공하면서 넷플릭스 자체 콘텐츠 제작은 탄력 받았다.
빅데이터가 콘텐츠 제작, 유통, 제조 등 산업 전반에 주요한 기술로 자리잡았다. 클라우드 환경이 확산되면서 대용량 데이터를 쉽고 저렴한 가격에 저장, 분석 가능한 시대가 열렸다. 차량, 건물 등 곳곳에 사물인터넷(IoT) 센서가 부착되면서 빅데이터 양은 기하급수적으로 늘어난다. 빅데이터를 어떻게 분석하느냐가 기업과 국가 경쟁력을 좌우한다.
우리나라도 2010년대 중반부터 빅데이터 기술 개발과 도입을 시작했다. 초반에 비해 빅데이터 시스템 구축과 관련 인력은 늘었지만 여전히 외국계 기업이나 국가에 비해 경쟁력이 뒤처진다. 기술부터 인력까지 경쟁력 확보를 위한 다방면 노력이 요구된다.
◇빅데이터 기술 격차, 3.4년...갈길 먼 한국
한국정보화진흥원에 따르면 우리나라 빅데이터 기술력은 선진 기술수준을 100으로 설정했을 때 62.7 수준(2016년 기준)에 불과하다. 선진국 수준이 되기까지 평균 3.4년이 걸리는 것으로 조사됐다. 여전히 빅데이터 기술은 해외 기업에 종속됐다. 빅데이터 저장을 위한 하드웨어(HW)부터 분석과 활용, 시각화 등 주요 소프트웨어(SW) 대부분이 외산이다.
해외는 우리보다 앞서 빅데이터 관련 핵심 기술을 속속 선보였다. 2000년대 초반 하둡을 비롯해 스플렁크, 스파크 등 빅데이터 수집, 분석 등 주요 기술은 해외에서 개발됐다. 우리나라는 자체 기술 개발보다 오픈소스로 공개된 기술을 활용해 서비스를 개발하는 방향을 택했다. 일부 국내 기업이 빠른 속도로 대용량 데이터를 처리하는 인메모리 데이터베이스 관련 기술을 선보였지만 국내 기업 제품 신뢰, 안정성 등을 이유로 확산은 더뎠다.
서정욱 SK(주)C&C 플랫폼&테크1그룹(빅데이터) 리더는 “글로벌 업체나 오픈소스 커뮤니티처럼 비즈니스 목적에 맞게 새로운 빅데이터 기술을 개발하거나 오픈소스화하는 단계까지는 아직 가지 못했다”고 말했다. 이어 “현재는 하둡 중심 데이터 엔지니어링 영역에서 고급 분석영역으로 확장하는 단계”라면서 “우리나라가 빅데이터 기술 경쟁력 확보를 위해 데이터 엔지니어링뿐 아니라 분석 영역도 플랫폼화고, 이 플랫폼을 클라우드 기반으로 해야 다양한 분석을 동시에 진행해야 빅데이터 기술 경쟁력을 확보할 것”이라고 덧붙였다.
◇기술력 강화 핵심은 '인재' 확보
전문가는 자체 기술 개발과 기술력 강화를 위한 우선 과제로 인재 확보를 꼽는다.
차경진 한양대 교수(경영정보시스템전공)는 “빅데이터 관련 인력을 구하기도 힘들지만 데이터사이언스지식 수준을 넘어 전체 빅데이터 프로젝트 프로세스 전반을 이해하는 사람도 부족하다”면서 “빅데이터 기술뿐 아니라 적용, 활용 단계별 도입을 위한 빅데이터 프로세스 전반을 이해하는 인재가 필요하다”고 말했다.
실제 인재 부족 현상은 기업 빅데이터 도입 저해 요소로 작용한다.
한국데이터산업진흥원에 따르면 국내 기업은 빅데이터 미도입 이유로 '관련 전문인력 부재(2018년·41.5%)'를 꼽았다. 2017년도 조사(26.4%) 때보다 10% 이상 응답자가 증가했다. 빅데이터 전문 인력 없이 시스템 구축뿐 아니라 제대로 된 분석은 요원해서다. 국내뿐 아니라 미국, 영국 등 주요국도 빅데이터 인재 양성에 집중한다.
인재 부족 현상은 계속 이어질 것으로 보인다. 향후 5년 내 전 산업 데이터직무 중 빅데이터 관련 필요 인력은 8067명으로 조사됐다. 올해 기준 빅데이터 관련 인력은 1244명 수준이다. 5년 내 7000여명가량 추가 인력이 필요하다. 한국데이터산업진흥원 조사 결과, 업계는 데이터 인력 양성을 위해 정부가 '실무중심 인력양성을 위한 기업 맞춤형 대학 데이터 교육 확대' '재직자 데이터 기술·직무능력 향상을 위한 지속적 교육 제공' '채용 인력 확보를 위한 기업 인턴십 지원 및 데이터 관련 인력 매칭 서비스 지원' 등 정책 지원이 필요하다고 답했다.
◇양질 데이터 확보 동반돼야
양질 데이터 확보는 빅데이터 기술 개발과 생태계 구축에 중요한 요인이다.
한국정보화진흥원 조사(2016년)에 따르면 기업은 빅데이터 시스템을 도입하지 않는 이유로 '빅데이터라고 부를 만한 데이터가 없기 때문'이라고 답했다. 2010년 중반 이후 대기업을 중심으로 빅데이터 시스템이 구축됐지만 무용지물이 된 경우가 많았다. 시스템을 구축해도 정작 시스템에 투입할 데이터 양은 턱없이 부족했다. 데이터 양이 많더라도 데이터가 제대로 정제되지 않아 활용도가 떨어지는 경우도 많았다.
차 교수는 “빅데이터 경쟁력을 확보하기 위해서는 양질 데이터를 융합·분석해 혁신적 서비스를 내놓아야 하는데 양질 데이터가 없다”면서 “그동안 빅데이터센터가 출범하고 데이터 구축·융합을 표방했지만 효용성 있는 빅데이터 플랫폼을 찾아보기 힘들다”고 지적했다.
이화식 엔코아 대표는 “최근 대기업을 중심으로 주요 계열사 데이터를 한 곳으로 모으는 작업을 진행 중”이라면서 “데이터를 확보하기 어려운 업계를 위해 정부가 공공 데이터 풀을 만들어 대량으로 공급해 데이터 수요·공급을 맞추는 정책을 계속 추진해야 한다”고 말했다.
해외는 양질 데이터 확보에 주력했다. 유럽연합(EU)은 유럽식 빅데이터 센터를 설립했다. 34개 유럽 국가로부터 수집한 24만 데이터세트를 오픈데이터로 공개했다. 미국도 미국 내 빅데이터를 효율적으로 수집·분석하기 위해 4개 허브를 구축해 데이터를 수집·관리한다. 우리나라도 최근 정부를 중심으로 분야별 빅데이터 플랫폼 구축을 추진한다. 공공데이터는 단순 개방 중심이 아니라 적재적소 필요한 데이터를 정제해 공개하는 방향으로 지원 정책을 이어간다.
한국과학기술기획평가원(KISTEP)은 “데이터 부족 관련 사물인터넷(IoT) 적용 대상이 점차 확대되면 상황이 점차 나아질 것”이라면서 “개인정보보호와 데이터 개방 거부감 등이 여전히 강하기 때문에 정책적 지원과 고객 인식 변화가 전제돼야 한다”고 말했다.
[표]국내 빅데이터 기술 수준(자료:한국정보화진흥원)
김지선기자 river@etnews.com