`하둡`과 `스플렁크`에 대적할 만한 빅데이터 처리 솔루션이 순수 국내 기술로 개발돼 주목받고 있다.
데이터스톰(대표 고익진·사진)은 3년 전부터 제품 개발에 착수해 하둡보다 데이터 수집과 검색 속도가 앞서는 `데이터스톰`을 개발, 영업에 착수했다고 4일 밝혔다.
데이터스톰은 기존 데이터베이스(DB)관리 솔루션의 한계를 극복하고 대용량 및 비정형 데이터 처리, 실시간 정보 수집·검색을 위해 개발됐다. 관계형데이터베이스관리시스템(RDBMS)이 빅데이터를 필요한 시점에 처리하지 못한다는 점에 착안, DB를 사용하지 않는 방식의 자체 엔진을 개발했다. 비정형 데이터 발생 서버 디스크에 에이전트를 설치해 실시간으로 데이터 처리가 가능하게 하는 게 핵심이다.
데이터스톰이 자랑하는 기술은 특정 필드만을 색인(인덱스)하지 않고 전체 텍스트를 실시간으로 인덱스하는 `리얼 인덱서(Real Indexer)`다. 기업 내 모든 데이터를 실시간으로 수집·검색할 수 있어 수 시간에서 수일까지 걸리던 분석 업무를 초 단위 내에 처리할 수 있다. 이 기술은 `리얼타임 인덱서 기반 데이터 수집`이라는 이름으로 특허출원 중이다.
장점은 성능뿐이 아니다. 하둡 기반 외산 빅데이터 솔루션은 원본데이터를 복제해 보관해야 하기 때문에 반드시 하드웨어 투자가 필요하다. 하지만 데이터스톰은 에이전트 방식과 복제 방식을 모두 제공하는 유연성을 가졌다. 에이전트 방식을 사용하면 하드웨어 투자비가 전혀 들지 않는다.
고익진 데이터스톰 사장은 “고객사 애플리케이션과 유연한 연동을 위해 애플리케이션프로그래밍인터페이스(API)가 제공돼야 하는데 외산 제품은 이런 면에서 한계를 가지고 있다”며 “데이터스톰은 고객과 협업으로 고객 상황에 맞는 빅데이터 시스템을 개발할 수 있다”고 말했다. 고 사장은 하둡은 전문가가 부족한 중소기업에서 사용하기 어려운 반면, 데이터스톰은 약간의 수정만으로 활용이 가능하다고 강조했다.
데이터스톰은 이미 보안 분야에 적용돼 새로운 침입형태 분석을 위한 대용량 네트워크 로그 기반의 실시간 분석 솔루션인 `빙고`로 재탄생했다. 한국컨설팅서비스진흥이 출시한 이 솔루션은 수 테라바이트(TB)에 이르는 대용량 로그 분석이 가능하다. 이 외에도 공공기관과 통신사 등 10여개 고객사에서 데이터스톰을 활용하고 있다.
고 사장은 “DB 시장이 외산 제품 일색인 상황에서 빅데이터 시장마저 내줄 수는 없다”며 “데이터스톰과 국내 SW회사가 협업해 `빅데이터 솔루션 클러스터`라는 생태계를 구축, 한국이 빅데이터 시장을 주도해 나갈 수 있었으면 한다”고 포부를 밝혔다.
데이터스톰이 말하는 빅데이터 접근 방식의 변화
안호천기자 hcan@etnews.com