로보코리아, 생성형 AI 음성합성 기술로 글로벌 콘텐츠 시장 누빈다

Photo Image
이승건 로보코리아 대표

“글로벌 인공지능(AI) 콘텐츠 제작 서비스 시장에서 한국을 대표하는 생성형 AI 음성합성 플랫폼 전문기업으로 성장할 계획입니다. 그리고 그 가능성을 실제 경영 성과로 입증하고 있습니다.”

이승건 로보코리아 대표는 “10초 내 빠른 음성 복제 기술과 사용자에 특화된 서비스 경쟁력을 바탕으로 글로벌 시장을 이끄는 리더로 발돋움하기 위해 노력하고 있다”라면서 이런 포부를 내비쳤다.

회사는 AI로 목소리를 만드는 기술과 서비스는 경쟁사 대비 월등한 음질의 목소리와 사용자경험을 제공한다는 평을 받고 있다. 100만 시간에 달하는 교육·마케팅용 음성 데이터를 독자적으로 구축하고 있다.

로보코리아는 2016년 미 실리콘밸리에서 창업 후 연구·개발한 음성합성 기술과 여러 생성 AI 기술을 기반으로 전문 지식이나 비싼 장비 없이도 누구나 손쉽게 음성과 영상 콘텐츠를 만드는 플랫폼 서비스를 제공하고 있다. 글로벌 AI 콘텐츠 제작 서비스 시장에서 음성과 영상 기술을 동시에 다루는 기업은 드문 편이다.

회사는 사업 초기부터 국내가 아닌 글로벌 시장에 먼저 눈을 돌렸다. 지멘스, 썰모피셔, 홈디포 등 글로벌 고객 유치에 전념한 덕분에 미국, 유럽, 인도 등 해외시장에서만 올해 매출 연 30억원을 무난하게 달성할 것으로 자신한다. 전체 매출의 95%가 해외 매출이 차지할 정도로 글로벌 무대에서 활동하는 스타트업이다.

로보코리아는 미국 UC 버클리대 출신의 공동창업자들을 비롯해 영국 케임브리지대, 홍콩 과기대, 스위스 취리히대, 서울대 등 8개국 출신의 인재들이 모인 스타트업(평균 연령 29세)으로 유니콘 기업을 꿈꾸고 있다. 현재 약 90억원의 누적 투자를 달성했다.

이승건 대표는 “사내 교육용 자료, 홍보·마케팅 콘텐츠, 게임·유튜브 영상 등 글로벌 포천 500 기업부터 개인 제작자까지 전 세계 40여개국 150만 명이 넘는 가입자가 로보코리아의 서비스를 활용하고 있다”라고 말했다.

특히, 올해 2월 출시한 신제품 '제니(Genny)' 반응이 뜨겁다. 고도 기술이나 비싼 장비, 외부 전문가 없이도 나 홀로 콘텐츠를 제작할 수 있어 출시 10개월 만에 전 세계 150만명의 사용자를 확보했다.

'제니'에서 사용자들은 AI를 활용해 대본을 작성하고, 음성으로 변환한 후 이미지와 음악을 생성한 뒤 효과음과 자막 등을 추가한 영상을 만들고, 마지막으로 번역·더빙을 통해 수십 개의 언어로 제공할 수 있기 때문이다.

원스톱 콘텐츠 제작 플랫폼 제니는 인터넷을 사용할 수 있는 곳이라면 어디든 손쉽게 접속해 사용이 가능하다. 게다가 기존 외주업체를 통해 제작하는 방식 대비 비용, 시간, 인적자원 등을 90% 이상 절감하는 효과를 얻을 수 있다.

이 대표는 “제니를 중심으로 한 실적과 시장의 수요를 바탕으로 현재 올해 초 대비 약 5배의 성장을 이루었으며, 연말까지 연간 매출 40억원 달성이 예상된다”라면서 “가파른 성장세를 내년에도 이어갈 수 있도록 제품개발은 물론 공격적인 마케팅과 채널 파트너십에 투자를 계획하고 있다”라고 강조했다.

이승건 대표는 “사용자 데이터를 기반으로 팀 단위 고객들의 효용성과 효율성을 높일 수 있는 기능 개발을 지속하고 글로벌 대형기업은 물론 국내외 스타트업들이 글로벌 시장 진출 시 필요한 홍보·제품 교육용 콘텐츠를 손쉽게 만들어주는 플랫폼이 된다”라면서 “미국, 유럽 등 기존 시장에서의 점유율 확대는 물론 자사 솔루션에 많은 관심을 보인 일본 시장 진출도 내년 하반기 가시화한다”라고 전했다.

안수민 기자 smahn@etnews.com