[테크 차이나] 오픈클로 4.5, 영상·음악 생성 기본 지원…장기 기억 기능 '드리밍' 도입

Photo Image
OpenClaw 로고. 〈출처:OpenClaw〉

중국 테크 미디어 36Kr는 최근 오픈클로(OpenClo)가 지난 4월 5일 공개한 4.5 버전에서 영상과 음악 생성 기능을 기본으로 지원하고, 대화와 작업 기록을 장기 맥락으로 정리하는 기억 기능 '드리밍(Dreaming)'을 새롭게 도입했다고 보도했다.

보도에 따르면 이번 업데이트는 단순한 기능 추가를 넘어, 여러 생성 모델과 작업을 하나의 흐름으로 묶는 에이전트 구조를 강화한 것이 특징이다. 사용자는 텍스트로 지시하면 영상과 음악을 동시에 생성할 수 있으며, 필요할 경우 이전 대화와 작업 기록을 기반으로 맥락을 이어가며 작업을 진행할 수 있다.

기존 생성형 AI 서비스는 텍스트, 이미지, 영상, 음악 등 기능이 개별적으로 분리돼 제공되는 경우가 많아, 사용자가 여러 도구를 오가며 결과물을 조합해야 했다. 반면에 오픈클로 4.5는 이러한 과정을 하나의 인터페이스 안에서 통합해 작업 흐름을 단순화하는 방향으로 설계됐다.

36Kr는 이 같은 변화가 특히 중국 시장에서 빠르게 확산할 가능성이 높다고 분석했다. 숏폼 콘텐츠 제작, 전자상거래, 라이브커머스, 게임, 교육, 광고 제작 등 다양한 산업에서 빠른 콘텐츠 생성과 유통이 요구되면서, 텍스트 중심 AI보다 영상과 음악을 포함한 멀티모달 에이전트 활용도가 높아지고 있다는 설명이다. 이에 따라 중국 플랫폼 기업과 개발자 커뮤니티도 이러한 도구를 적극 도입하고 있는 것으로 전해졌다.

이번 업데이트는 AI 경쟁 구도 변화 가능성도 시사한다. 기존에는 개별 모델 성능이 경쟁력 핵심으로 여겨졌다면, 앞으로는 여러 모델을 얼마나 자연스럽게 연결하고 실행할 수 있는지가 중요한 요소로 부상할 수 있다고 분석한다. 하나의 영상 생성 모델 성능을 개선하는 것보다, 사용자가 별도 설정 없이 다양한 모델을 호출해 활용할 수 있도록 하는 실행 프레임워크가 더 큰 가치를 가질 수 있다는 의미다.

'드리밍' 기능 역시 주목할 만한 변화로 꼽힌다. 36Kr는 이 기능이 사람의 수면 단계와 유사한 방식으로 정보를 정리하는 구조를 채택했다고 전했다. 이를 통해 AI는 단발성 응답 중심 도구에서 벗어나, 장기적인 맥락을 관리하고 축적하는 협업형 시스템으로 발전할 가능성이 있다. 향후 생성 기능과 기억, 실행 과정이 분리되지 않고 하나의 흐름으로 통합될 것이라는 전망도 제기된다.

36Kr는 오픈클로 4.5가 완성된 형태의 기술이라기보다 생성형 AI가 나아갈 방향을 보여주는 사례라고 평가했다. 개별 기능 성능 개선을 넘어, 복수 모델과 기억 구조를 결합해 하나의 작업 흐름으로 제공하는 '운영체계형 AI'로의 진화를 시사한다는 것이다.

업계에서는 이러한 변화가 AI 활용 방식 전반에도 영향을 미칠 것으로 보고 있다. 생성 결과 품질뿐만 아니라, 여러 작업을 어떻게 연결하고 이어가는지가 핵심 경쟁 요소로 부상할 가능성이 크다고 분석한다.

※전자신문과 36케이알이 공동 기획한 기사입니다.


김현민 기자 minkim@etnews.com

브랜드 뉴스룸