정부, 전자정부법 시행령 개정안 입법 예고…전산 안정 강화
트래픽 급증 등 장애 발생 예측해 AI로 진단해 2시간 전 경고
“정부와 공공기관의 전산센터는 언제 터질지 모르는 데이터 장애 때문에 고민에 빠졌습니다. 전자정부법 개정안으로 전산 담당자 역할은 커졌지만 관련 적정 예산을 확보 못 해 담당자로선 '폭탄 돌리기' 하는 형국이라면서 불안해합니다.”
박영찬 지케스 대표는 이처럼 예산 부족으로 정부 공공기관 전산 담당자가 난처하다는 얘기를 자주 듣는다고 화두를 꺼냈다.
문제는 예산과 인력이다.

박 대표는 “정부와 지자체 등에 1만 6000개 행정망 관련 서버가 있는데 장애 관리를 위해서는 산술적으로 1조원이 넘는 예산이 소요된다”고 말했다.
시행령이 만들어졌다고 당장 예산이 준비된 게 아닌 만큼 인력과 예산 확보는 전산 담당자의 몫이 되는 게 현실이다.
전 시스템을 AI로 관리할 솔루션을 구매한다면 당장 막대한 예산이 필요하지만 박 대표는 구독형 서비스를 대안으로 제시했다.
그는 “공공서비스 관제 체계를 최적화하고, 쉽게 접근할 수 있도록 편리성을 높인 구독형 모델이 바로 M클라우드”라고 소개했다.
지케스는 2003년부터 행안부 산하 245개 자치단체에 통합정보자원관리시스템(지킴-e)을 구축한 통합관제서비스 경험을 녹여 지난 2023년 'M클라우드'를 내놨다.
일반적인 장애관리 시스템이 장애가 발생한 후 이를 감지하고 대응하는 방식이지만, 지케스가 개발한 AI 기반 장애 예측 시스템인 M클라우드는 장애가 발생하기 전, 실시간으로 문제를 감지하고 사전 대응할 수 있도록 설계됐다.
M클라우드는 순환신경망(RNN)과 장단기메모리(LSTM) 딥러닝 모델을 기반으로 업무 서버 및 네트워크 장비에서 수집된 다양한 리소스 정보를 학습해 2시간 후의 성능 변화를 예측하는 방식이다. 이를 통해 서버의 메모리 사용량, 파일시스템 용량, 트래픽 부하, 온도 및 습도 변화 등의 데이터를 분석해 사전에 장애 가능성을 경고할 수 있다. 기존 장애 모니터링 시스템이 고정된 임계치를 설정해, 특정 수치를 초과할 경우 경고를 보내는 방식이지만 서버 및 네트워크 장비의 부하 상태는 실시간으로 변동되며, 일정한 패턴을 갖는 경우가 많다. 따라서 실시간 데이터 분석과 동적 임계치 설정으로 정확한 예측을 구현했다. 또 실시간 데이터만 활용하던 기존 시스템과 달리 과거 데이터까지 활용함으로써 광범위한 예측이 가능하다. 특히. 2시간 단위 장애 예측으로 실시간 장애만 감시할 수 있던 기존 시스템과 확실한 차별점을 뒀다.
지케스는 실제 30여개 지자체와 금융기관에 도입돼 트래픽 급증에 따른 장애 발생을 2시간 전 경고함으로써 장애를 미리 방지했다.
전체 시스템을 관제한다면 운영솔루션 자체 시스템에 부하를 줄 수 있지만 M클라우드는 운영체계(OS) 커널 기반 에이전트 방식으로 용량과 업무 부하가 없는 게 특징이다.
박 대표는 “공공기관 전산센터는 담당자 출장이나 휴일 등에도 24시간 365일 안전하게 관리할 수 있어야 한다”며 “M클라우드는 AI로 작은 징후까지 사전에 예측할 수 있어 적은 비용으로 효율적인 관리가 가능하다”고 강조했다.
이경민 기자 kmlee@etnews.com