“최근 챗GPT 활성화 이후 1년 간 생성AI 관련해 차원이 다른 기술적 진보가 이뤄졌다. AI 기술을 기반으로 한 서비스는, 특히 최근 나온 GPT-4o는 더욱 서비스가 사용되는 맥락 및 정황을 잘 이해하고 필요에 따라 사용자의 감정을 파악해 그에 적절한 서비스를 제공할 수 있게 됐다.”
박성준 상명대학교 교수는 15일 잠실 광고문화회관에서 열리는 'GPT-4o 등 멀티모달모델이 가져올 파급효과 전망 그리고 AI-UX의 변화' 세미나에 앞서 가진 인터뷰에서 최근 출시된 GPT-4o의 의미에 대해서 이렇게 밝혔다.
박성준 교수는 “GOT-4o는 기존의 언어 기반 입출력 뿐만 아니라 실시간 영상/이미지와 음성 대화를 통합한 것이 핵심이며 여기서 더 나아가 사용자의 감성을 인식하고 AI도 감성을 표현할 수 있다는 것이 핵심”이라고 설명했다.
그는 “GPT-4o를 통해 영상 및 음성 기반 화자인식을 통해 특정 사용자를 특정할 수 있다”면서 “사용자가 입력했거나 AI가 파악한 정보를 통해 진정한 초개인화 기반 서비스가 가능해지는 계기가 될 것”이라고 말했다.
박성준 교수는 “AI 기술의 자연적인 수순은 진정한 멀티모달모델(LMM)”이라면서 그 첫번째가 GPT-4o의 등장이라고 덧붙였다. LMM은 텍스트, 이미지, 오디오, 비디오 등 여러 포맷의 데이터를 처리하고 생성할 수 있는 모델을 뜻한다.
그는 “GPT-4와 같은 진보된 모델은 기억 모듈을 통합했다”면서 “기존에는 RAG/랭체인의 벡터 메모리 모듈을 활용해 대화 세션이 끝나더라도 AI가 이전 대화 내용을 기억해 연계해야 했었다”면서 “이번에 GPT-4o가 그것을 통합해버려서 별도의 라이브러리 없이도 GPT만으로 가능해졌다”고 말했다. 이에 따라 대화경험은 더 맥락적으로 관련성이 높아지며 개인화된 상호작용이 가능해짐으로 소비자 UX는 제고될 것으로 예상된다.
박 교수는 GPT-4o 등이 서비스에 가져올 영향에 대해서도 설명했다. 그는 “음성(Vocie) UX가 가능해지면서 그동안 제한돼 있었던 음성인식 스피커와 같은 경험들이 GPT 기반의 LLM으로 가능한 경험과 통합됐다”고 말했다. 이는 LLM 기반 음성 중심 서비스들이 다시 등장하며 사용편의성을 높일 것으로 예상된다.
박성준 교수는 GPT-4o 등장으로 인공지능 UX의 변화도 가져올 것으로 보고 있다. 그는 “서비스 디자인과 UX 프로토타이핑에서 애자일 디자인 및 개발의 본연의 철학을 충실하게 적용하는 것은 매우 중요하다”면서 “이를 통해 디자인 과정이 더 빠르고, 거칠지만 올바른 수준에서의 프로토타이핑이 가능해질 것”이라고 말했다. GPTs와 같은 최신 생성 AI 기술을 활용하면 최소 실행 가능한 제품(MVP)을 내놓는 것이 5분 미만으로도 가능해진다는 것이다.
박 교수는 “AI 서비스를 만드는 기획자, 개발자, 디자이너는 기술의 트렌드는 파악하되 그것만 보면 새로운 UX나 서비스를 창출할 수 없다”면서 “기술 및 서비스 트렌드를 민감하게 보되 더 느리고 변화하는 사용자의 심리 및 근원적인 니즈를 파악해야 임팩트를 줄 수 있는 서비스가 나올 수 있다”고 조언했다.
한편 박성준 상명대학교 교수는 15일 열리는 'GPT-4o 등 멀티모달모델이 가져올 파급효과 전망 그리고 AI-UX의 변화' 세미나에서 서비스 디자인 방법론과 UX 프로토타이핑 등에 대한 시연도 함께 진행할 예정이다. 행사에 대한 더 자세한 정보는 자세한 정보는 컨퍼런스 홈페이지(https://conference.etnews.com/conf_info.html?uid=307)에서 확인할 수 있다.
유은정 기자 judy6956@etnews.com