KISTI 슈퍼컴센터 종합상황실 가동

 슈퍼컴퓨팅센터 종합상황실 모니터. 시스템이 다운됐다는 표시와 함께 음성 메시지가 흘러나왔다. 이와 동시에 관리책임자인 김중권 실장에게도 휴대폰 벨이 울려댄다. 비상상황임을 알리는 문자 메시지가 전달된 것이다.

 퇴근 후 집에 있던 김 실장은 즉각 종합상황실에 전화를 걸어 사태를 파악한 뒤 적절한 조치를 취해 슈퍼컴과 전국의 초고속연구망이 정지되는 사태를 막았다. 하마터면 큰일 날 뻔했기에 김 실장은 안도의 한숨을 몰아쉰다.

 한국과학기술정보연구원 슈퍼컴퓨팅사업실(실장 김중권)이 최근 슈퍼컴퓨터를 보유한 국내 기관으로는 처음으로 멀티미디어 솔루션을 모두 갖춘 종합상황실을 구축하고 본격 가동에 들어갔다.

 종합상황실이 구축되면서 다양화·대규모화되고 있는 슈퍼컴퓨터 관련 시스템들과 설비의 상태 및 장애를 24시간 실시간 모니터링하는 일이 가능해진 것.

 이곳에서 관리하고 있는 시설은 IBM 및 NEC, HP 시스템, PC클러스터 등 슈퍼컴퓨터와 대용량 저장장치 및 내부 고성능 네트워크 시스템 등 대부분 정지되면 치명적인 손실을 입게 되는 핵심 장비들이 대부분이다.

 종합 상황실에는 50인치 스크린 6개로 구성된 프로젝션 시스템과 70인치짜리 독립적인 스크린이 각각 슈퍼컴퓨팅 사업실과 초고속망사업실에 설치돼 슈퍼컴의 상황을 실시간 모니터링하고 있다.

 또 이들 6개의 스크린에는 슈퍼컴퓨터와 네트워크 시스템 정보, 온도·습도 등의 환경정보 및 CCTV에 나타나는 종합적인 상황을 한눈에 보고 있다. 이곳에 구축된 음성경보 시스템은 또 이들 모니터에 전달되는 장애 등을 음성으로 변환시켜 스피커로 출력함과 동시에 관계자들에게 휴대폰 문자메시지로 연락까지 해주기 때문에 24시간 시스템 상태나 장애의 조기감지가 가능하다.

 관리인력도 이전보다 2분의 1 이상을 줄였다. 발주업체 인원을 제외하고 20명이 넘게 근무했으나 지금은 8명이 3교대로 근무하고 있다.

 김 실장은 “전에는 퇴근 후 슈퍼컴 장애가 발생했을 경우 출근해서 알거나 사용자가 알려와 장애발생 사실이 파악된 경우가 있었으나 지금은 실시간 장애감지로 신속한 조치가 가능해졌다”며 “지난 ‘1·25 인터넷 대란’이 재연되더라도 초고속연구망과 슈퍼컴퓨터가 피해를 입지는 않을 것으로 본다”고 말했다.

 <대전=박희범기자 hbpark@etnews.co.kr>

 

 사진설명:KISTI의 PC클러스터 관리자인 성진우 연구원이 종합상황실 모니터의 감시 영역을 설명하고 있다.

브랜드 뉴스룸