오픈AI, 챗GPT 이미지 생성 기능 강화…텍스트와 시각 통합

Photo Image
샘 올트먼 오픈AI 최고경영자(CEO)(사진 오른쪽)가 개발진과 함께 새 기능을 설명하고 있다.

오픈AI가 '챗GPT'에 탑재된 기본 이미지 생성 도구 기능을 대폭 강화했다.

사용자는 챗GPT를 통해 텍스트에 기반한 것보다 일관되고 사실적인 이미지를 생성할 수 있게 됐다.

오픈AI는 이날부터 '챗GPT-4o 이미지 생성(ChatGPT-4o Image Generation)' 모델을 출시한다고 25일(현지시간) 밝혔다.


이번 업데이트로 오픈AI는 챗GPT의 이미지 생성 도구를 '달리'에서 자사 최신 AI 모델인 'GPT-4o'로 통합, 전환했다.

그동안 오픈AI는 GPT 모델을 텍스트 생성 전용으로, '달리'는 이미지 생성 전용으로 구분해 운영해 왔다. 그러나 이번 개편으로 하나의 모델에서 텍스트와 이미지 생성을 모두 처리할 수 있도록 했다.

GPT-4o를 텍스트, 이미지 등 멀티모달 데이터 학습을 통해 강화하고, 모든 작업을 수행할 수 있는 '옴니(Omni)' 모델로 발전시키겠다는 것이다.

오픈AI는 이번 업그레이드가 챗GPT의 그래픽 디자인 성능을 크게 향상시킬 것이라고 말했다.

기존에는 이용자가 원하는 이미지를 위해 프롬프트를 하나하나 입력해야 했지만, 새 모델은 이용자의 의도를 파악해 이미지를 생성한다는 것이다. 복잡한 요청도 쉽게 수행한다고 강조했다.

오픈AI의 설명에 따르면 뉴턴의 상대성 이론을 설명하는 카툰(만화)을 그리거나 실제 사진을 바탕으로 하는 맞춤형 그래픽 이미지 제작, 사용자 요청에 따라 그림의 배경을 지우거나 추가하는 등 다양한 작업도 보다 정교하게 수행할 수 있다.

오픈AI의 멀티모달 담당인 가브리엘 고는 “우리는 텍스트에 대한 지능을 가진 GPT-4의 강점과 최고의 이미지 생성 모델의 시각적 지능을 결합한 모델을 만들고자 했다”며 “이번 모델이 바로 그 목표를 달성한 결과물”이라고 말했다.

오픈AI는 딥페이크, 불법 콘텐츠 생성을 방지하고 워터마크 제거를 방지하기 위한 조치도 추가했다. 생성된 이미지에는 눈에 보이는 워터마크가 없지만 AI가 생성한 것으로 식별하기 위한 C2PA 메타데이터가 포함됐다. 아울러 이미지 출처를 추적하는 도구를 개발하고 있다고 덧붙였다.

오픈AI는 새 모델은 프로, 플러스 등 유료 가입자는 물론, 무료 가입자도 사용할 수 있고 전했다. 또 기능을 응용프로그래밍인터페이스(API)를 통해 개발자가 자체 애플리케이션에 통합할 수 있도록 할 계획이다.


김명희 기자 noprint@etnews.com

주요 행사

브랜드 뉴스룸