단순 탐지 넘어 상황 추론…서울시, 생성형 AI CCTV 관제 구축 돌입

발행일 : 2026-05-17 17:00 업데이트 : 2026-05-17 12:21

Photo Image — 서울시가 단순 객체 구분 기능으로 인해 오탐률(잘못된 탐지)이 높은 지능형 CCTV에 생성형 AI를 적용해 관제 정확도 고도화에 나선다. 서울 마포구 서울시CCTV안전센터에서 관제요원이 관내 CCTV 관제를 하고 있다. 이동근기자 foto@etnews.com

서울시가 생성형 인공지능(AI)을 활용한 차세대 CCTV 관제 체계 구축에 본격 착수했다. 단순 객체 탐지 수준을 넘어 영상 속 상황의 맥락과 위험도를 이해·판단하는 상황 이해형 AI 관제 체계로 고도화한다.

17일 서울시에 따르면 시는 최근 '생성형 AI 기반 지능형 CCTV 관제 고도화' 사업 공고를 내고 사업자 입찰에 나섰다.

이번 사업 핵심은 기존 지능형 CCTV의 한계를 생성형 AI 기반 영상 이해 기술로 보완하는 데 있다. 현재 지능형 CCTV는 사람·차량 등 객체를 인식하거나 특정 행동을 규칙 기반으로 탐지하는 수준으로 실제 위험 상황을 판단하는 데 한계가 있다. 그림자·기상 상황·동식물 등에 따른 오탐(잘못된 탐지)과 과탐(과대 탐지) 문제로 관제 요원의 알람 피로도나 집중력 저하 우려도 제기된다.

서울시는 이를 해결하기 위해 생성형 AI 기반 비전언어모델(VLM)을 도입해 관제를 고도화하기로 했다. 기존 지능형 CCTV를 통한 1차 영상분석 알람 위에 생성형 AI 기반 2차 판단 엔진을 도입해 1차 알람의 진위 여부를 재검증하고 실제 위험 상황만 선별 표출하는 방식이다.

2차 판단엔진은 VLM 기반 심층 추론을 통해 영상 분석 결과를 종합 해석하고 상황 맥락 기반 위험도 재판단하기 때문에 분석 정확도를 개선할 수 있다.

예를 들어 기존 CCTV가 단순히 '사람 쓰러짐'이나 '배회'를 탐지해 이후 관제요원이 육안으로 판단해야했다면, 생성형 AI는 주변 상황과 연속 행동, 객체 간 상호작용 등을 함께 분석해 실제 응급 상황인지 여부를 판단하게 된다. AI는 관제요원에게 위험 상황 요약과 판단 근거, 주요 판단 요소까지 함께 제공하도록 설계된다.

서울시는 시범 자치구 1곳을 대상으로 생성형 AI 기반 관제 서비스를 우선 구축하고 시범사업을 진행할 계획이다.

행동·상황·맥락을 종합적으로 이해하는 관제 체계 구축으로 오탐과 과탐을 줄이고 실제 위험 상황 중심의 선별 관제를 구현해 사건 인지 시간과 초기 대응 시간 단축이 가능할 것으로 시는 기대하고 있다.

서울시 측은 “생성형 AI 기반 관제를 통해 불필요한 탐지 알림을 기존 대비 60% 이상 감소시켜 관제 대응 효율이 향상될 것으로 기대한다”면서 “시범사업 이후 다른 자치구로 확대와 함께 타 안전 분야로 확산 적용이 가능한 표준 관제 모델로 발전시킬 계획”이라고 밝혔다.

정현정 기자 iam@etnews.com