[CIOBIZ+/핫이슈]알기 쉬운 공공부문 빅데이터 활용 방안

관련 통계자료 다운로드 공공 빅데이터 분석 활용 가이드 구성

최근 공공 부문에서 빅데이터 분석과 활용에 대한 수요가 크게 증가하고 있다. 국가 안전·위험관리·치안·의료·교육·복지·환경 등 사회전반에 걸쳐 빅데이터 활용 가능성이 높아지고 수요도 크게 증가했다. 그러나 빅데이터 수행을 위한 국내 사례와 가이드가 많지 않아 실무 담당자들이 추진과정에서 많은 시행착오를 겪고 있다. 한국정보화진흥원(NIA)은 공공부문 실무 담당자를 위해 사업목표와 방향설정, 사업 추진과 관리를 위한 체계적인 절차와 점검항목 등을 제시한 가이드를 마련했다.

[CIOBIZ+/핫이슈]알기 쉬운 공공부문 빅데이터 활용 방안
Photo Image

기획단계에서는 가장 먼저 빅데이터 분석과 활용으로 해결하려는 문제를 명확히 해야 한다. 문제해결을 위한 사용자 관점에서 빅데이터 분석 시나리오를 구성한다. 다른 기관이나 해외 선행사례 연구로 이해를 높이고 실현 가능성을 검토, 시사점을 도출한다. 빅데이터 분서과 활용으로 문제를 해결하고 조직과 국민에게 가치를 창출 할 수 있는 시나리오를 작성한다.

조직의 임무·목적과 가장 부합하는 사업을 선정한다. 최적 대안으로 빅데이터 사업이 선정되면 조직 내부의 데이터 정책과 외부 환경에 따라 분석환경구축형으로 추진할지, 분석서비스를 활용할지 결정한다. 분석 대상 데이터 확보를 위한 제반 환경과 관리절차도 검토한다. 분석 플랫폼 후보를 조사하고 목표와 내부 운영환경과의 적합성을 파악한다. 구축 활용뿐 아니라 운영·관리를 위한 예산을 확보한다.

시스템 구축과 활용 외에 전문 인력·조직 양성 운영방안을 만든다. 사업 성과목표와 목표 달성을 위한 요구사항도 제시한다. 사업비 산정, 관리계획 수립, 계획서 검토, 사업자 선정 등을 이어 진행한다.

설계단계에서는 사업계획의 전반적 이해를 갖춰야 한다. 사업목표와 구현방안 이해가 필요하다. 정책에 반영하고 활용을 위해 빅데이터 분석으로 예상되는 시나리오를 상세화 한다. 예상 시나리오에 대한 이미지와 기대수준을 책정한다. 빅데이터 수집·정제·범위선택과 분석모델을 선정한다.

빅데이터 분석과 활용을 위한 시스템 기능과 성능 요구사항을 분석한다. 데이터 수집이 가능한 데이터 소스를 확보하고 데이터 이관 절차 등을 조사해 설계에 반영한다. 데이터 연계를 위한 기관 내외부 서비스 운영환경을 이해하고 있는지, 구축 확보될 분석 시스템이 기본 운영시스템과 연동성·상호운용성을 가지고 있는지도 파악한다. 참조용 원시 데이터 확보도 필요하다. 해킹과 바이러스 등의 보안체계와 개인정보보호 정책도 설계에 반영한다.

구축 단계는 크게 데이터 획득과 통합, 데이터 관리와 조직화, 분석 모델링·수행, 결과배포·관리시스템 4단계로 나눠 이뤄진다. 데이터 획득과 통합에서는 수집할 데이터를 분류하고 데이터 수집 경로에 따른 수집시스템을 구축한다. 수집된 데이터 보관·분석·공유·보안을 위한 이중화 체계를 갖춘다. 데이터 생애주기도 관리한다. 데이터 관리와 조직화에서는 데이터 선택과 변환, 데이터 품질 확보, 데이터 저장과 관리, 데이터 자동 분류와 색인 성능 조절 등을 수행한다.

운영·관리단계에서는 운영조직화와 거버넌스 확보가 이뤄져야 한다. 운영조직화에서는 분석 시스템의 운영관리를 위한 전담인력 업무역량 분석과 교육·훈련 방안을 마련한다. 거버넌스 확보에서는 데이터 품질·분석·보안·서비스 운영관리를 위해 협력적 거버넌스를 확보한다.

마지막 확장단계에서는 분석확장, 상호운용성 확보, 변화관리 3단계를 거친다. 분석확장에서는 분석 범위와 항목 확대가 필요하다. 상호운용성 확보에서는 분석 품질 향상을 위해 데이터와 서비스 상호운용성을 고려한다. 다양한 데이터 수집·분석과 재활용성을 위한 변화 관리를 한다.

공공부문 빅데이터 활용 사례

빅데이터는 공공부문에서 다양하게 활용할 수 있다. 특정 주제에 대한 시민의 목소리를 이해하고 그 추이를 분석해 민원센터 로그와 소셜데이터에 반영한다. 정책의제 발굴과 확보를 위한 중요한 분석으로도 활용된다. 사회이슈를 자동 감지하고 연관 주제의 동향을 분석해 잠재 정책 수요를 발굴하거나 지역별 이슈를 도출하고 맞춤형 대국민 서비스 전략을 수립 할 수 있다.

의료보험 비용을 분석해 사회 최적화, 부당청구 방지, 복지정책 입안과 만족도를 알아낼 수 있다. 지역별 복지 불균형 해소 등으로 의료와 복지지출 데이터, 민원센터 로그, 소셜데이터, 서비스 기관 홈페이지 등을 통합 분석한다. 국가 연구개발(R&D) 사업제안서, 보고서, 비용지출 데이터, 특허 등을 분석해 국가 R&D 사업을 효율적으로 운영할 수 있다.

지역별·기관별 민원인 행동과 요구사항 분석으로 민원행정 서비스의 개인 맞춤형 시스템을 구현한다. 교육환경 개선과 교육민원 처리, 합리적 교육 예산 집행과 절감 위해 빅데이터를 분석, 활용한다. 교육예산 집행 데이터, 각종 보고서와 소셜데이터, 민원센터 로그 등을 통합 분석하면 된다.

유행 전염병, 질병에 대한 예측, 대응과 지역별 분포 분석, 연도별 거시적 분석, 가축전염병과 환경, 이동경로 등에 대한 패턴을 찾을 수 있다. 금융거래 이상 징후와 조세회피, 탈세 등 패턴 감지와 조기 대응력을 확보 할 수 있다. 금융과 조세정책에 대한 시민인식도 높인다.

도로 센서 네트워크와 사건사고 등 다양한 데이터를 활용해 교통 흐름 모델링을 예측한다. 국가 안보 관련한 국내외 주요 이슈를 모니터링 해 국방과 안보 관련 정책 입안 자료로도 활용한다.

빅데이터 사업 유형과 설명

자료 : 한국정보화진흥원

빅데이터 분석 활용 가이드 구성

자료 : 한국정보화진흥원