보안 데이터셋 'HIA 1.0' 공개
운영기술 영역사이버 위협 늘자
국내외 기업·연구자 지원 나서
세계권위학회서 우수성 인증도
국가보안기술연구소가 인공지능(AI) 학습용 산업제어시스템(ICS) 보안 데이터셋 'HAI 1.0(HIL based Augmented ICS testbed)'을 공개했다. AI 기술을 활용한 ICS 보안 연구 기틀을 마련했다.
사이버 보안 위협은 정보기술(IT) 영역을 넘어 운영기술(OT) 영역으로 확대됐다. 2015년과 2016년에 사이버 공격으로 대규모 정전을 겪은 우크라이나가 대표 사례다. 각국이 ICS 보안 연구개발에 돌입한 가운데 이번 HAI 데이터셋 공개로 우리나라는 ICS 보안 기술 경쟁에서 한 발 앞서는 기반을 확보했다. 실제 ICS 운영 환경으로부터 데이터를 확보할 수 없어 연구에 어려움을 겪던 국내외 기업과 연구자에게 도움이 될 것으로 기대된다.
HAI 데이터셋은 AI를 이용한 ICS 보안 기술 개발에 적합한 데이터셋이다. 수작업에 의존하는 기존 데이터셋 데이터 라벨링 한계점을 극복해 데이터 신뢰성을 보장한다. 공격 수준별 데이터 생성이 가능하며 정밀한 성능평가가 가능하다. 이는 지난해 8월 이 분야 세계 최고 권위 학회인 'USENIX 2019'에서 발표돼 우수성을 입증 받았다. 크기는 현재 세계에서 가장 많이 사용되는 싱가포르 국립대학 SUTD '스왓(SWaT)' 데이터셋과 비슷하다.
국보연은 HAI 데이터셋 개발을 위해 기반시설과 산업현장에서 널리 사용되는 GE, 에머슨, 지멘스 등 산업용 제어기기, 센서, 액추에이터를 이용해 2017년부터 테스트베드를 구축했다. 연구용 테스트베드 한계점을 깨기 위해 발전 시스템을 모사하는 HIL(Hardware-In-the-Loop) 시뮬레이터를 연동하는 실시간 데이터 증강기술을 개발했다. ICS에서 발생 가능한 공격을 재현하는 기술도 함께 개발했다. 스턱스넷 같이 공격행위 은닉까지 자동 재현할 수 있다.
HAI 1.0 데이터셋은 현재 세계 최대 개발자 커뮤니티인 깃허브에 공개됐다. 구글 데이터셋 서치를 통해서도 쉽게 검색할 수 있다.
국보연은 ICS에 특화한 보안 위협을 계속 발굴해 데이터셋을 보강할 계획이다. 올해 하반기에는 보안 데이터셋을 활용한 ICS 보안 위협 탐지 대회를 개최한다.
조현숙 국보연 소장은 “연구소가 보유한 제어시스템 테스트베드와 HAI 데이터셋 개발 기술을 바탕으로 국내 ICS 보안 기술 R&D 생태계를 조성하고 국제 경쟁에서 앞서 나갈 수 있도록 하겠다”면서 “스마트시티 등 국민 생활과 밀접한 기반시설을 겨냥한 사이버 공격으로부터 국민이 안전한 나라를 만드는 데 기여할 것”이라고 말했다.
오다인기자 ohdain@etnews.com