[이슈플러스]'AGI' 기반 AI 전쟁 3라운드 점화

Photo Image

인공지능(AI) 전쟁이 3라운드로 진입한다.

AI '알파고' 대 '이세돌' 대전, 오픈AI의 '챗GPT' 출시에 이어 3라운드는 사람과 비슷하거나 사람보다 뛰어난 지능을 가진 '초지능 AI'의 등장이 핵심이다. 인공일반지능(AGI, Artificial General Intelligence) 시대가 조기에 열릴 수 있다는 전망이 나온다.

마이크로소프트(MS)와 오픈AI 연합, 구글의 반격, '챗GPT' 대항마로 불리는 앤쓰로픽 '클로드3'의 도전 등 글로벌 빅테크 간 경쟁이 AI 기술 발전을 가속화시키고 있다.

스스로 업무를 알아서 수행하는 'AI 에이전트' 확대로 AI 도구-〉AI 어시스턴트(보조원)-〉AI 에이전트(비서)' 순으로 글로벌 AI 기술 고도화 경쟁이 본격화될 것으로 예상된다.

◇알파고, 챗GPT, 다음은 'AGI'=업계와 학계에선 거대언어모델(LLM, Large Language Model) 중심 기술 경쟁이 AGI 개발로 이어질 것으로 예상하고 있다.

이미 오픈AI를 필두로 마이크로소프트(MS)와 구글, 애플까지 자사 서비스와 결합한 AI 에이전트 출시를 잇달아 예고하고 있다.

Photo Image
오픈AI가 홈페이지에 공개한 'GPT-4o' 설명 영상 캡쳐

특히, 오픈AI가 지난 달 선보인 'GPT-4o'는 AI 에이전트이자 AGI 시대를 앞둔 첨병으로 여겨진다. GPT-4o는 주로 텍스트로 대화를 주고 받았던 이전 서비스와 달리 실시간 음성으로 질문과 답변을 할 수 있다.

애플은 GPT-4o를 자사 음성 비서 '시리(Siri)'에 탑재한다고 발표했다. 이를 통해 사용자에게 보다 고도화된 AI 비서 기능을 제공할 수 있게 됐다. 사용자의 스마트폰 화면을 이해하고 음성 명령을 수행하는 단계로 발전해나가는 단초가 마련됐다.

구글도 지난달 구글연례개발자회의(I/O)에서 새로운 '프로젝트 아스트라'를 공개했다. 아스트라는 텍스트뿐만 아니라 이미지, 영상, 음성 등을 한 번에 처리할 수 있는 AI 비서 서비스다.

MS는 2019년부터 일찌감치 오픈AI에 투자하며 연합 체제를 구축했다. 자사 PC 운용체계 '윈도'를 넘어 IT 서비스 전반에 AI 비서인 '코파일럿'을 제공한다는 방침이다.

기존에는 사용자가 기차표를 예매하려면 티켓 예매 사이트나 애플리케이션(앱)을 직접 열어 애매해야 했다. AI 에이전트는 사용자의 일정을 파악하고 직접 앱을 열어 표를 예매하는 식이다.

조용상 한국열린사이버대 객원교수(AI 아키텍트)는 “AI 에이전트는 일정한 상황에서만 발동하는 AI와 달리 상황과 맥락을 읽고 스스로 행동한다는 점에서 영화 '허(her)'의 컴패니언 모습과 가장 비슷하다”며 “고도로 발달한 AI 에이전트는 초기 AGI 모델이나 마찬가지”라고 설명했다.

◇AI부터 LLM까지 게임 룰의 진화=앞서 구글 딥마인드가 개발한 알파고는 글로벌 IT산업에서 AI 기술의 새로운 가능성을 제시했다.

알파고는 딥러닝 기술을 포함해 심층 신경망, 강화학습, 지도학습 등 여러 AI 기술을 결합해서 만든 바둑 AI 프로그램이었다.

Photo Image
AI '알파고' 대 이세돌 9단 대국 당시 모습

2016년 3월 알파고와 이세돌 대전은 세계적 관심을 불러일으켰고, AI와 머신러닝 기술 개발에 대한 투자를 촉진시켰다. 국내외 주요 AI 프로젝트가 '알파고'를 계기로 출발했다.

2017년 구글 브레인팀이 현재의 GPT의 원천 기술이 되는 '트랜스포머' 모델을 개발하며 AI 기술 발전은 새로운 전환기를 맞게 됐다. 자연어처리(NLP) 분야에서 혁신적 변화를 가져온 트랜스포머 모델은 방대한 데이터 셋을 바탕으로 AI 기술의 새 가능성을 제시했다. 현재 사용되는 대다수 LLM이 이 트랜스포머 모델 기술을 기반으로 개발됐다.

오픈AI은 트랜스포머 모델을 기반으로 LLM인 GPT 시리즈를 개발한 선구자다.

LLM은 통상 10억개 이상의 파라미터(매개변수)를 가진 언어모델을 가리킨다. 방대한 양의 웹 문서와 책, 기사 등을 통해 데이터를 학습, 복잡한 언어패턴과 문맥을 이해, 생성할 수 있다.

이때 나온 파운데이션모델(Foundation Model, FM)이 GPT-3, GPT-4 등이다. 일종의 범용 AI 모델로 이를 바탕으로 다양한 생성형 AI 서비스를 개발할 수 있다. 매개변수가 작은 FM을 경량형 모델(SLM) 등으로 부르기도 한다.

LLM이나 FM은 주로 텍스트 언어를 이해, 생성하는 모델을 가리킨다. 텍스트, 이미지, 영상 등을 모두 포괄하는 생성형 AI가 훨씬 넓은 개념이다. 2022년 11월 30일 출시됐던 챗GPT는 GPT-3.5를 기반으로 만들어진 대화형 생성형 AI 서비스였다.

이는 챗봇 형태로 이전의 AI 기술에 비해 사용자 친화적이지만, 텍스트 언어라는 한계가 존재한다. 결국 일상과 산업 현장에서 다방면으로 활용되기 위해서는 AI 에이전트 형태 발전이 필연적이라는 것이다.

◇AGI, 이미지·영상까지 읽고 생성=AGI는 예고된 미래다. 생성형 AI 시대를 이끌고 있는 오픈AI의 차세대 모델인 'GPT-5'는 이르면 하반기나 내년 초 출시될 것으로 점쳐진다.

오픈AI도 AGI 출시가 가까워졌음을 사실상 시인했다. 지난달 28일 자사 블로그를 통해 “최근 차세대 프론티어 모델 교육을 시작했다”며 “AGI로 가는 길에서 다음 단계 기능을 제공할 것으로 기대한다”고 밝혔다.

Photo Image

일각에선 오픈AI 최고경영자(CEO)인 샘 올트먼이 지난해 회사에서 축출 당했다 5일만에 복귀한 시점에 이미 AGI 개발이 본격화된 것으로 분석하기도 했다. AGI 출시가 눈앞으로 다가오면서 'AI 안전성'을 추구하는 오픈AI 내 그룹과 샘 올트먼이 충돌했다는 분석이다.

AGI는 이미지와 영상을 읽고 생성하는 '멀티모달 플래그십 모델'이 될 가능성이 높다. 이미 오픈AI는 텍스트만 입력하면 마치 실제와 같은 영상을 생성해내는 '소라(Sora)'를 공개한 바 있다.

나아가 보다 방대하고 다양한 사용자 경험(UX)과 함께 상황과 맥락 등이 반영된 '컨텍스트 데이터'를 필요할 것으로 예상된다. 환각(할루시네이션)을 최소화하고 보다 정확하고 효율적인 작업 수행을 위해서다. 국내외 LLM 기업들이 산업별, 분야별 기업과 손잡고 합종연횡을 시도하는 것도 이러한 이유 때문이다.

빅테크 간 AGI 경쟁이 본격화되면서 국내 기업의 선택과 집중이 필요하다는 목소리도 높다.

업계 관계자는 “LLM을 국내에선 '초거대 AI'로 부르기도 하지만, 이러한 거대 AI 모델 개발이 정답은 아니다”라며 “기업과 산업에 맞춤형 서비스 개발로 다양한 성공 사례를 만들어가는 노력이 더 필요하다”고 말했다.

Photo Image
인공지능(AI) 전쟁 관련 연표

김명희 기자 noprint@etnews.com