[ET단상]시스템 관리자의 역할과 책임

Photo Image

시스템 관리자는 IT 조직 핵심 위치에서 서버, 가상화, 네트워킹, 스토리지 등 조직의 컴퓨팅 인프라를 관리한다. 소위 시스어드민이라고도 불리는 시스템 관리자는 수년 동안 리눅스나 유닉스 시스템을 보편적으로 다뤄왔다.

지난달 29일 '시스템관리자 감사의 날'을 맞아 시스템 관리자 현 위치를 알아보고 앞으로 방향에 대해 생각해 보고자 한다.

과거엔 유닉스 시스템 관리자가 슈퍼 유저 권한이나 루트 비밀번호를 가지고 썬 솔라리스 서버에 오라클 설치를 요청했다. 최근 데브옵스 환경에서 시스템 관리자는 MS 액티브 디렉토리와 같은 핵심 시스템을 관리하거나 조직에서 핵심 역할을 수행하는 사이트 안정성 엔지니어링(SRE) 팀의 일원인 경우가 대부분이다.

시스템 관리자는 서버의 가동 시간 목표 충족을 보장하면서 운영 및 실행 상태를 유지하는 것을 우선으로 해야 한다. 비록 단순하게 들릴지 모르지만 이러한 목표 달성을 위해서는 많은 작업이 요구된다. 그중에서도 운영 시스템·하드웨어·하이퍼바이저에 패치를 적용하거나 업그레이드하고 시스템 백업을 보장하는 두 가지 업무를 기본적으로 수행한다.

복잡성과 시스템 수가 증가함에 따라 자동화와 이를 지원하는 스크립팅이 업무 수행에 필요한 기술로 떠올랐다. 대부분 시스템 관리자는 자신이 개발자라고 생각하지 않지만 다양한 종류의 셸 스크립트를 작성하는 데 뛰어난 능력을 갖추고 있다.

조직의 디지털 전환이 종종 시스템 관리자의 책임을 정의하는 것에 영향을 미친다고 판단된다. 예를 들어 대규모 조직은 보통 전담 네트워크 관리자가 있지만 시스템 관리자도 네트워킹 및 방화벽에 대해 어느 정도 책임질 수 있다. 이러한 하이브리드 역할은 지역 네트워크, 광역 네트워크, 시스코(Cisco) 라우터 등 네트워크 인프라 관리를 시스템 관리자 업무로 포함한다.

클라우드 컴퓨팅을 활용하는 조직의 경우, 시스템 관리자는 클라우드 리소스 및 네트워크 관리도 담당할 수 있다. 뿐만 아니라 스토리지 인프라를 관리하고 서버 및 인프라에 적절한 스토리지 리소스 제공하기도 한다.

인프라와 조직 구조를 보다 현대적으로 바꾸고 있는 조직에서는 시스템 관리자 역할이 SRE 팀으로 할당된다. 이때 필요한 기술은 기존 시스템 관리와 거의 비슷하나 쿠버네티스(Kubernetes)를 통해 컨테이너를 조정하거나 다양한 유형의 데브옵스 툴을 활용해 소프트웨어 배포 모니터링을 하고 문제 해결하는 등 새로운 기술도 다루기도 한다.

시스템 관리자의 일상 업무는 매우 다양하다. 광범위한 컴퓨터 시스템 관리는 여러 가지 다른 업무로 이어지기 때문이다. 어느 날은 사용자 문제나 기술 지원 문제를 해결하고 또 다른 날은 운영 중지 및 업무 투입량을 줄이기 위해 문제 해결과 자동화 개발을 할 수 있다.

시스템 관리자는 작업 투입량을 줄이기 위해 보통 서드파티 툴을 사용해 대시보드 하나에서 보다 쉽게 이기종 시스템 모니터링을 진행한다. 이러한 툴 사용은 통합 알림 요소를 통해 단일 대시보드에서 알림과 경고를 신속하게 볼 수 있게 하고, 시스템 관리자의 생산성 향상에 도움이 된다. 시스템 관리자는 수동 작업을 간소화하고 적절한 모니터링, 알림 및 자동 교정 솔루션을 제공하는 데 능하다. 그로 인해 조직 전반에 걸쳐 IT 전문가 생활을 개선하는 데 도움을 줄 수 있다.

시스템 관리자에 대한 많은 직무 기술서가 컴퓨터 공학 또는 학사 학위를 조건으로 포함하고 있으나, 필수 요구 사항으로 간주해서는 안 된다. 헬프데스크 직책이나 최종 사용자를 지원하는 관련 분야에서 시작해 성장한 시스템 관리자도 많다. 헬프데스크에서 커리어를 시작하면 미래의 IT 전문가로서 시스템 관리자가 매일 사용하는 중요한 스킬을 습득할 수 있다고 생각한다. 다른 부서와 협업해 문제를 보다 효과적으로 해결 가능하며, 미래의 시스템 관리자로서 다양한 IT 분야를 직접 경험해 볼 수 있다.

시스템 관리자에게 가장 중요한 자질은 문제와 이슈를 날카롭게 파악하고 해결하는 능력이다. 대부분 컴퓨터 시스템은 오류를 기록하므로 문제를 해결하기 위해 로그에서 오류를 찾고 때때로 문제의 근본 원인을 설명하는 암호 같은 메시지를 이해해야 한다. 하드웨어 또는 소프트웨어 문제를 해결할 때 신속하게 어디서 무엇을 봐야 하는지 파악하면 운영 중단이나 시스템 성능 문제의 원인을 보다 효율적으로 파악할 수 있다.

또 팀 내에서 협업하고 팀 구성원은 물론 기술 예산을 결정하는 타부서 직원과도 잘 소통해야 한다. 광범위한 전문 기술과 호기심도 필요하다. 본질적으로 변화가 잦은 다양한 유형의 시스템을 다루게 되므로 새로운 기술을 빠르게 익힐 수 있어야 한다.

클라우드 부상으로 물리적 하드웨어 관리 관련 요구 사항은 줄었지만 시스템이 복잡해지고 분산되면서 시스템 관리자 역할은 10년 동안 계속 확대됐다. 운영 환경을 유지하고 작업을 최적화하며 시스템을 보호하는 팀과 엔지니어가 그 어느 때보다 필요하다. 시스템이 존재하는 한 스크립팅, 문제 해결 및 모니터링 스킬은 모든 조직의 핵심이 될 것이다.

박경순 솔라윈즈 코리아 지사장 korea.info@solarwinds.com


브랜드 뉴스룸