Photo Image
루마 AI의 영상 생성 AI 서비스 드림 머신으로 제작한 영상의 한 장면. '선글라스를 낀 테디 베어가 크고 아름다운 폭포 앞의 정글에서 헤드뱅잉을 하며 춤을 추고, 일렉트릭 기타를 연주하고 있다'라는 명령어를 입력한 지 2분 만에 5초 분량의 영상이 만들어졌다.

명령어만 입력하면 영상을 만들어주는 영상 생성 인공지능(AI) 모델이 잇달아 공개되면서 패권 경쟁이 치열해지고 있다.

영상 AI 스타트업 런웨이는 17일(현지시간) 이전 세대 대비 영상 품질과 제작 속도를 높인 영상 생성 AI 모델 '젠-3 알파(Gen-3 Alpha)'를 출시했다.

텍스트나 이미지를 프롬프트에 넣으면 젠-3 알파가 영상을 만들어준다.

젠-3 알파는 10초 분량 영상을 90초 안에 생성하고, 사람의 행동, 제스처, 감정 표현에 탁월하다고 회사는 설명했다.

런웨이는 젠-3 알파를 유료 사용자에게 곧 정식 공개할 예정이다.

앞서 미국 AI 스타트업 루마 AI는 지난 13일 영상 생성 AI 서비스 '드림 머신'의 베타 버전을 출시했다.

문장을 입력하면 드림 머신이 약 2분 만에, 5초 분량 실사 영상을 생성한다. 누구나 웹사이트에서 무료로 이용해볼 수 있다.

루마 AI는 응용 프로그래밍 인터페이스(API)와 주요 크리에이티브 소프트웨어(SW) 플러그인을 출시할 계획이다.

Photo Image
지난달 2월 오픈AI의 동영상 생성 인공지능(AI) '소라'가 만들어낸 영상의 한 장면. AI에 '잘 차려입은 여성이 불빛이 가득한 도쿄 거리를 거닐고 있다'고 입력해 나온 결과물이다. [사진=오픈AI]

중국 내 틱톡 경쟁사인 콰이쇼우는 지난 10일 클링(Kling)을 발표했다.

클링은 1080p 해상도에 초당 30프레임으로 단 하나의 프롬프트로 2분 분량 비디오를 생성할 수 있다는 점에서 소라를 능가했다는 평가를 받았다.

구글은 지난 달 AI 영상 생성 도구 비오(Veo)를 공개했다. 비오는 문구를 입력받으면 풀HD 수준의 영상을 만들어낸다.

영상 생성 AI 모델 경쟁의 포문을 연 것은 오픈AI다. 오픈AI는 지난 2월 '소라(Sora)'를 출시하며 생성 AI의 활용 영역을 영상으로 넓혔다.

Photo Image
주요 동영상 생성 AI 서비스

글로벌 시장조사기관 더비즈니스리서치컴퍼니는 AI 영상 생성 시장 규모가 지난해 5억7000만달러(약7900억원)에서 연평균 22.4%씩 성장해 2028년에는 15억7000만달러(약 2조2000억원)에 달할 것으로 전망했다.

영상 생성 AI 도구 시장 규모가 커지는 주요 배경은 숏폼 영상의 인기다. 영상 생성 AI 도구는 대체로 1분 이내 짧은 영상을 만든다는 한계가 있지만, 숏폼 영상 제작에는 적합하다.

일각에서는 영상 생성 AI 모델이 데이터를 무단으로 학습했다는 논란이 해소돼야 한다는 지적이 나온다.


오픈AI 소라는 구글 유튜브나 메타의 인스타그램 등에 사용자들이 올린 영상들을 학습했다는 의혹에 휩싸이기도 했다.


현대인 기자 modernman@etnews.com