[미리보는 ITCE 2025]피아스페이스, VLM 기반 멀티모달 AI 영상 분석 솔루션 선봬

발행일 : 2025-10-17 17:50 업데이트 : 2025-10-18 08:56

피아스페이스는 '2025 대한민국 ICT융합 엑스포(ITCE 2025)'에서 VLM 기반 멀티모달(Multi-modal) AI 영상 분석 솔루션 'MACS(Multi-modal AI for CCTV Solution) 2.0'를 선보일 예정이다.

'MACS 2.0'은 멀티모달 AI 기반의 실시간 이상상황 자동탐지 소프트웨어다. 고객의 환경에 따라 구축형(On-Premise), SaaS형, Edge형 등 다양한 서비스 모델로 제공된다.

기존 제품인 SSAVE(Smart Search AI for Video Editor)가 태깅 없이도 영상의 의미를 이해하고 검색할 수 있는 멀티모달 기반 검색 솔루션이었다면, MACS는 이를 한 단계 발전시켜 실시간 긴급상황 탐지·대응이 가능한 수준으로 고도화했다.

Photo Image — 피아스페이스는 ITCE 2025에서 멀티모달 AI 영상 분석 솔루션 'MACS'를 소개한다.

MACS는 기존 CCTV 인프라(NVR, DVR, VMS)와 손쉽게 연동 가능하다. 영상은 디코딩 과정을 거쳐 멀티모달 AI 탑재 비디오 벡터 인코딩 모듈에서 특징 벡터를 추출한 뒤, MACS 탐지 모듈을 통해 실시간 분석이 이뤄진다. 탐지된 이벤트는 VMS나 독립형 모니터링 UI에 즉시 알림으로 표출되며, SSAVE 모듈과 연계된 벡터 데이터베이스를 통해 원본 영상과 함께 검색·분석할 수 있다.

특히 비전언어모델(VLM)과 객체탐지(Object Detection)의 앙상블 구조를 채택해 단순 객체 인식을 넘어 행위·맥락 기반의 복합 상황 해석이 가능하다. 더 나아가 VQA(Visual Question Answering) 기법을 적용, 단순한 알람 수준을 넘어 탐지된 이상 상황의 원인과 맥락을 자연어 질의응답 형태로 제공한다.

사용자 관점에서 경량화·최적화된 구조 덕분에 고사양 GPU 서버가 없어도 다채널 실시간 영상 처리와 AI 추론 가속화를 구현할 수 있다. VMS가 없는 환경에서도 독립형 웹 서비스로 운용이 가능해 공공·민간 고객 모두 상황과 규모에 맞게 유연하게 도입할 수 있다.

단순한 AI CCTV가 아니라, 실시간 맥락 이해와 제로샷 탐지 기술을 통해 기존 솔루션의 한계를 근본적으로 극복한 차세대 영상분석 플랫폼이다. 기존 AI CCTV가 객체 중심 탐지에 머물러 사전 학습된 범위 내 상황만 인식할 수 있는 것과 달리, MACS는 영상 프레임의 맥락과 의미를 이해해 사전 학습이 없는 새로운 상황까지 감지할 수 있다.

피아스페이스는 관련 특허만 총 13건을 출원했다. 또 한국정보통신기술협회(TTA), 한국인터넷진흥원(KISA), 한국산업기술시험원(KTL), 한국화학융합시험연구원(KTR) 등으로부터 9건의 공인 인증을 취득했다. 특히 KISA의 지능형 CCTV 성능 시험에서 요구되는 90% 정확도 기준을 상회, 배회(96%), 쓰러짐(95.3%), 침입(98%) 등에서 업계 최고 수준의 성능을 입증했다.

한편, 올해 20회를 맞는 'ITCE 2025'는 대구시가 주최하고 엑스코, 전자신문, 대한무역투자진흥공사(KOTRA)가 공동 주관한다. ICT 분야 선도기업 및 주요 기관 130여 개사가 대거 참여한다.

대구=정재훈 기자 jhoon@etnews.com