[IP노믹스]20대 총선 결과, 빅데이터로 미리 본다

4·13 총선이 5일 앞으로 다가오며 각 여론조사 기관이 다양한 예측 결과를 내놓는 가운데 `빅데이터 기반 선거 예측 시스템`이 개발돼 눈길을 끈다.

JPD 빅데이터 연구소(대표 장수진)가 개발한 선거예측 분석 시스템 `JEFA(JPD Election Forecasting Analysis System)`는 지난 선거 빅데이터를 기반으로 이번 총선 결과를 예측한다.

Photo Image
빅데이터 기반 선거 예측 시스템 `JEFA` 분석 구조 / 자료: JPD 빅데이터 연구소

JEFA는 지난 20년간 선거 결과를 통해 누적된 연령대별 정당 투표율을 기본 데이터베이스(DB)로 한다. 지역구별로 연령대에 따른 정당 지지율·투표수를 도출한 후, 여기에 현재 인구를 적용해 후보별 득표수를 산출한다. 기존의 연령대별 지지율에 올해 2월 기준 인구를 대입해 예상 득표수를 역산출하는 방법이다.

2단계로 지역구별 정치 환경 변수를 추가 적용한다. 실시간 여론조사 결과와 정당 이슈, 정책 변수 등을 더해 분석 데이터를 정교화한다. 3단계에서는 뉴스와 SNS 분석 등을 통해 훑은 민심을 데이터에 더한다. 뉴스와 SNS 자료를 전수 조사해, 후보자와 관련해 쓰인 어휘의 긍정도·부정도를 수치화하는 셈이다. 3단계 빅데이터 분석 결과를 종합해 선거 결과를 예측한다.

JEFA 시스템을 개발한 장수진 대표는 “빅데이터 기반 선거 예측은 기존의 설문 중심 여론조사의 오류를 크게 줄인 방법”이라며 “누적 데이터에 실제 여론조사와 민심을 더해 신뢰도를 높였다”고 강조했다.

장 대표에 따르면 JEFA는 총선 결과가 나오면 예상치와 결과치 간 오류를 패턴화해 알고리즘에 새로 추가한다. 다음번 오차를 줄이기 위해서다. 인간을 이긴 구글의 바둑 인공지능 알파고가 패배 결과를 자체 데이터에 누적하며 자체 학습하는 것과 같은 방법이다.

※상세 내용은 IP노믹스 홈페이지( www.ipnomics.co.kr )에서 확인할 수 있습니다.


양소영 IP노믹스 기자 syyang@etnews.com


브랜드 뉴스룸