통계 기반 미래예측형 비즈니스 분석 구현 방안

Photo Image

몇 년 전 가트너는 `가트너 비즈니스 인텔리전스 서밋`에서 “대부분의 기업들은 회사에 어떤 고객 데이터가 있는지 살펴보고 그 데이터를 분석하고 분석된 결과를 비즈니스에 활용하는 하향식 접근법을 시도하는데, 정작 분석 결과를 활용하는 단계에서는 효과적인 실행 능력의 부족함을 통감하게 된다”라고 지적했다. 오늘날에도 상황은 크게 달라진 게 없다.

고객 데이터, 거래 데이터, 접촉 데이터, 프로세스에 대한 데이터 등이 기하급수적으로 증가해 기업 내부 데이터는 수십TB에 이른다. 이 데이터에는 기업의 비즈니스를 향상시키는데 활용할 수 있는 가치 있는 지식들이 숨겨져 있다. 하지만 대부분의 기업들은 축적된 데이터로부터 가치 있는 지식들을 잘 추출하지 못하고 있다.

이러한 현상이 발생되는 원인은 데이터를 분석해 기업에 무슨 일이 일어나고 있는지 이해하고 무슨 일이 일어날지 예측하는 능력의 부족 때문이다. 설령 지식을 추출했다고 하더라도 추출된 지식을 기반으로 실행하는 능력이 부족하다. 이 부족한 능력을 보완하기 위해 기업은 예측분석(Predictive Analytics) 능력을 갖춰야 한다고 가트너는 지적하고 있다. 예측분석은 현재의 상태와 미래의 이벤트에 대한 믿을만한 결론을 도출해줌으로써 데이터와 적절한 행동을 연결시키는 것을 가능하게 해준다는 게 가트너의 설명이다.

◇예측과 실행능력의 간극을 메워주는 예측분석=예측분석은 미래지향적인 분석이며, 실행 가능한 행동을 도출하는 분석이다. 예측분석은 통계분석이나 데이터마이닝과 같은 고급분석과 스코어링 엔진, 룰 기반 엔진, 추천 엔진, 최적화 엔진과 같은 의사결정 최적화 시스템이 결합된 형태이다. 즉, 통계분석이나 데이터마이닝을 통해서 직접적인 의사결정을 지원하는 실행 가능한 정보를 만들어내고 이를 상시적으로 이용 가능하도록 시스템화하여 활용한다는 것을 의미한다.

그렇다면 왜 많은 회사에서 예측분석을 사용하고 있지 않는 것일까. 모든 비즈니스 분석의 진입 장벽은 기술에 있지 않다. 기업의 임원들이 그 기술을 얼마나 잘 이해하고 필요성을 느끼는가에 있다. 토마스 데이븐포트는 그의 저서 `분석 경쟁(Competing on Analytics)`에서 기업들이 예측분석을 도입하지 않는 이유는 예측분석을 잘못 이해하고 있는 인식과 태도에 있다고 밝혔다.

최근 비즈니스 분야의 베스트셀러로 선정된 `슈퍼크런처(Super Crunchers)`라는 책이 있다. 슈퍼크런처는 데이터를 수집하고 분석하여 유용하고 결정적인 정보를 추출해내는 사람들인데, 대규모 데이터세트를 분석해서 외관상 무관한 일들 사이의 상관관계를 발견해 직관적이고 경험적인 전문지식에 의존하고 있는 기존의 전문가들을 앞서고 있다고 말하고 있다. 다음은 이 책에서 언급한 주된 내용들이다.

△구글은 당신보다 당신의 취향을 더 잘 안다.

△흥행 가능성이 높은 영화대본을 영화제작사보다 정확하게 예측하는 프로그램이 있다.

△신용카드사는 신용기록을 이용해 당신의 이혼 가능성까지 예측한다.

△의사보다 정확한 진단을 내리는 통계프로그램이 의사들의 입지를 축소시킨다.

△와인의 품질을 정확하게 예측하는 공식이 와인평론가들을 실업자로 만들고 있다.

△프로야구 스카우터보다 정확하게 대어급 신인을 골라내는 통계프로그램이 야구계를 뒤흔들고 있다.

△비행기 좌석 예약이 취소되면 항공사들은 단골고객이 아니라 돈을 많이 내는 고객에게 자리를 먼저 배정한다.

슈퍼크런처는 데이터로 경쟁에서 승리하는 치밀한 혁신가들이다. 이미 많은 기업과 기관에서 과거보다 합리적이고 효과적인 정책을 수행하기 위하여 전문가들을 대신하여 슈퍼크런처들을 활용하고 있다고 강조하고 슈퍼크런칭의 세계에 동참하라고 권유하고 있다.

◇예측 분석의 성공적 도입 방안=예측분석을 도입함에 있어서 많은 기업들이 높은 투자회수(ROI) 효과를 가져다 주는 종합선물세트를 기대한다. 그러나 이러한 종합선물세트는 존재하지 않는다. 대신에 기업이 할 수 있는 것은 대부분의 중요한 비즈니스 문제를 하나씩 해결하는 기술을 접목시켜나감으로써 얻어지는 조그마한 ROI 버튼들을 모아서 회사에 큰 ROI를 가져다 주는 하나의 큰 버튼을 만드는 것이다.

축적된 고객데이터를 기반으로 예측분석을 접목해 가능성이 높은 고객들과 그렇지 못한 고객들을 잘 선별했다고 하더라도, 이러한 결과를 적용해 제한된 회사의 자원을 선택된 고객들에게 집중하지 않는다면 회사 차원에서 높은 ROI를 얻기 힘들다. 예측분석을 수행하는 부서의 결과를 고객접점상의 부서에서 신뢰하지 않고 활용하지 않는다면 결과적으로 얻어지는 ROI는 만족스러운 수준이 되지 못한다는 이야기이다.

예측분석을 조기에 도입했지만 성공적으로 정착시키지 못한 많은 기업의 담당자들은 “너무 어렵고 이해가 안 되어서 초기 프로젝트 때 반짝하고 끝냈다”라고 변명한다. 혹은 유지보수를 하고 싶어도 툴 의존도가 높아 예측모델을 바꾸기가 어렵고 업데이트 때마다 업체를 불러야 한다고 말한다.

이는 예측분석의 시스템화와 관리의 실패라고 보아야 한다. 예측분석은 분석으로 끝나는 것이 아니라, 실행부서의 업무 프로세스를 개선하고 의사결정을 최적화하는 데 활용돼야 한다. 그러기 위해서 무엇보다 필요한 것은 시스템화라고 할 수 있다.

예측모델의 정확도를 높이고 어떻게 하면 더 좋은 모델을 만들기 위해 고민만 한다면 예측분석의 도입은 실패로 끝나게 된다. 그보다는 어떻게 하면 다수의 구성원들에게 잘 쓰게 할 수 있을지, 예측모델들을 잘 관리하려면 어떻게 해야 할지, 예측모델을 웹으로 공유해 많은 사람들이 사용하도록 어떻게 시스템화할지 등의 관점으로 인식을 전환해야만 예측분석을 성공적으로 정착시킬 수 있다.

결론적으로 성공적인 예측분석을 도입하기 위한 플랫폼은 다음과 같이 구성돼야 한다. 즉, 통합된 데이터뷰를 통해 기업 내 다양한 데이터 소스에 접근할 수 있어야 하고, 이러한 데이터를 기반으로 비즈니스의 과거와 현재를 이해하며, 가까운 미래의 비즈니스 상황을 예측할 수 있어야 한다.

이에 효율적으로 대응하기 위해서 취해야 할 액션을 도출해 다양한 의사결정 최적화 시스템과 연계해야 한다. 또 다양한 고객접점에서 동작하는 웹시스템, 콜센터시스템, 캠페인시스템, 리스크관리시스템, 고객피드백관리시스템, 클레임처리시스템 등의 운영시스템과 연계해야 한다. 그래야 예측분석의 이점을 최대한 활용할 수 있다.

정성원 SPSS코리아 이사 jung@spss.co.kr

브랜드 뉴스룸