명령어만 입력하면 영상을 만들어주는 영상 생성 인공지능(AI) 모델이 잇달아 공개되면서 패권 경쟁이 치열해지고 있다.
영상 AI 스타트업 런웨이는 17일(현지시간) 이전 세대 대비 영상 품질과 제작 속도를 높인 영상 생성 AI 모델 '젠-3 알파(Gen-3 Alpha)'를 출시했다.
텍스트나 이미지를 프롬프트에 넣으면 젠-3 알파가 영상을 만들어준다.
젠-3 알파는 10초 분량 영상을 90초 안에 생성하고, 사람의 행동, 제스처, 감정 표현에 탁월하다고 회사는 설명했다.
런웨이는 젠-3 알파를 유료 사용자에게 곧 정식 공개할 예정이다.
앞서 미국 AI 스타트업 루마 AI는 지난 13일 영상 생성 AI 서비스 '드림 머신'의 베타 버전을 출시했다.
문장을 입력하면 드림 머신이 약 2분 만에, 5초 분량 실사 영상을 생성한다. 누구나 웹사이트에서 무료로 이용해볼 수 있다.
루마 AI는 응용 프로그래밍 인터페이스(API)와 주요 크리에이티브 소프트웨어(SW) 플러그인을 출시할 계획이다.
중국 내 틱톡 경쟁사인 콰이쇼우는 지난 10일 클링(Kling)을 발표했다.
클링은 1080p 해상도에 초당 30프레임으로 단 하나의 프롬프트로 2분 분량 비디오를 생성할 수 있다는 점에서 소라를 능가했다는 평가를 받았다.
구글은 지난 달 AI 영상 생성 도구 비오(Veo)를 공개했다. 비오는 문구를 입력받으면 풀HD 수준의 영상을 만들어낸다.
영상 생성 AI 모델 경쟁의 포문을 연 것은 오픈AI다. 오픈AI는 지난 2월 '소라(Sora)'를 출시하며 생성 AI의 활용 영역을 영상으로 넓혔다.
글로벌 시장조사기관 더비즈니스리서치컴퍼니는 AI 영상 생성 시장 규모가 지난해 5억7000만달러(약7900억원)에서 연평균 22.4%씩 성장해 2028년에는 15억7000만달러(약 2조2000억원)에 달할 것으로 전망했다.
영상 생성 AI 도구 시장 규모가 커지는 주요 배경은 숏폼 영상의 인기다. 영상 생성 AI 도구는 대체로 1분 이내 짧은 영상을 만든다는 한계가 있지만, 숏폼 영상 제작에는 적합하다.
일각에서는 영상 생성 AI 모델이 데이터를 무단으로 학습했다는 논란이 해소돼야 한다는 지적이 나온다.
오픈AI 소라는 구글 유튜브나 메타의 인스타그램 등에 사용자들이 올린 영상들을 학습했다는 의혹에 휩싸이기도 했다.
현대인 기자 modernman@etnews.com