미래창조과학부는 창의적 문제 해결형 인재를 발굴하고자 데이터 분석 경진대회를 개최했다. 이번 대회에서는 두 개의 문제를 제시해 최선의 분석 결과를 도출한 팀을 선정했다.

첫 번째 문제는 기존 개봉 영화 흥행실적 및 콘텐츠 정보에 기반을 두고 개봉 예정이었던 영화의 흥행 실적을 예측하는 것이다. 대상 영화는 11월 14일 개봉한 `친구2`, 11월 28일 개봉한 `리딕`, 12월 5일 개봉한 `어바웃 타임`이다. 세 영화의 12월 7일 기준 흥행(누적관객 수)을 예측하는 과제다. 제공된 데이터는 2012년 1월부터 올해 6월 개봉한 영화의 제목, 감독, 배우, 개봉일, 흥행실적이다. 댓글 정보는 11월 28일 13시까지의 데이터를 제공했다.
두 번째 문제는 한 달 동안의 트위터 데이터를 갖고 있을 때 매일 가장 많은 사람이 주목한 이슈를 찾고 순위를 매기는 것이다. 미래부는 서류평가, 대면평가를 거쳐 총 11개 수상팀을 결정해 총 4000만원의 상금을 수여했다.
대상은 연세대학교 재학 중인 배정환·한남기·홍예리씨로 구성된 팀이 수상했다. 이 팀은 트위터 분야에 참여했으며 토픽 모델링을 이용한 스토리텔링화로 문제를 해결했다. 시각화를 이용한 트렌드와 유사도 정보를 제공해 호평을 받았다.
배정환씨는 “빅데이터를 다루는 의미 있는 경험을 쌓을 수 있었던 기회였다”며 “이번 경험을 바탕으로 관련 연구에 더욱 노력하겠다”고 말했다.
최우수상은 덕수고등학교 재학생 황준오씨와 고려대학교 학생으로 구성된 강지훈·박찬희·도형록씨가 받았다. 황준오씨는 영화 분야에 참여했다. 분석 솔루션 활용을 벗어나 엑셀을 사용해 스스로 익힌 독창적 방법으로 결과를 도출했다.
고려대학교 팀은 주어진 데이터뿐만 아니라 관련된 모든 데이터를 취합·적용해 분석에 활용했다. 강지훈씨는 “학교에서 흔히 접하는 연구 측면 데이터 분석이 아닌 실제 우리 생활과 밀접한 분야의 데이터를 분석해 학문적·경험적 도약이 가능했다”고 수상소감을 밝혔다.
이밖에 우수상은 △이형기, 박종민, 최기웅씨(국민대학교) △임관훈, 최용찬, 이은경씨(단국대학교) △박치완, 조현제, 김영덕씨(연세대학교) △김홍기, 최승진, 강성현씨(중앙대학교) 등 네 개 팀이 받았다. 장려상은 △박준범씨(과학기술연합대학원대학교) △전인수씨(서울대학교) △김준민, 길유진, 홍수린씨(연세대학교) △최봉준, 안기호씨(연세대학교) 등 네 개 팀이 수상했다.
유선일기자 ysi@etnews.com



















