카카오, '고품질 인물 이미지 생성 기술'로 세계 최고 학회서 주목

Photo Image
카카오가 자체 개발한 인공지능(AI) 기반 인물 이미지 생성 기술 예시 〈자료 카카오〉

카카오가 고품질 인물 이미지 생성 기술로 세계 최고 권위 컴퓨터 비전 학술대회에서 주목을 받았다.

카카오는 자체 개발한 인공지능(AI) 기반 인물 이미지 생성 기술이 세계 최고 권위의 컴퓨터 비전 학회 'CVPR 2025'에서 하이라이트 논문으로 선정됐다고 11일 밝혔다. 지난해에 이어 2년 연속으로 하이라이트 논문에 선정됐다.

CVPR은 구글 스칼라 기준 컴퓨터 과학 분야 세계 1위, 전체 과학 분야에서는 네이처에 이어 2위에 해당하는 최상위 학회다. 올해 행사는 미국 내슈빌에서 11일 시작해 오는 15일까지 열린다. 총 1만3008편 논문이 제출된 가운데 2878편만 채택됐다. 카카오가 선정된 하이라이트 논문은 이 가운데 387편에만 주어졌다.

이번에 선정된 카카오의 논문명은 'Boost Your Human Image Generation Model via Direct Preference Optimization'이다. 실사에 가까운 고품질 인물 이미지를 생성하는 새 학습 기법 제안에 대한 내용을 담았다.

기존 직접 선호 최적화(DPO) 방식은 AI가 생성한 이미지에 대한 비교 데이터를 바탕으로 학습되기 때문에 실제 인물 디테일이나 자연스러운 표현에는 일부 한계가 존재한다. 카카오는 고품질 이미지 생성을 목표로 실사 이미지를 선호 데이터로 활용하는 방식을 도입했다. 여러 단계로 나뉜 학습을 쉬운 단계부터 점진적으로 수행하는 방식인 커리큘럼 학습 전략도 병행했다.

한 예로 '단발머리 스타일에 흰색 드레스를 입고, 수국 꽃밭을 배경으로 웃으면서 촬영한 나의 근접 촬영 구도 프로필'과 같은 구체적인 요청 시 사용자 얼굴과 분위기를 반영한 고품질 맞춤 이미지를 생성할 수 있다. 카카오는 이는 사용자의 고유한 시각 특성을 반영하는 '개인화된 텍스트-이미지 생성'이 효과적으로 가능함을 보여주는 사례라고 설명했다.

논문에 포함된 연구 결과는 카카오의 자체 개발 이미지 생성 모델인 '콜라주 바이 카나나'의 고도화에도 활용되고 있다.

최동진 카카오 카나나 멀티모달 모델 리더는 “고품질 인물 이미지 생성 기술은 연구·개발적인 도전을 넘어 실제 서비스 분야에서도 큰 수요가 있는 영역”이라면서 “이번 CVPR 성과를 바탕으로 사용자 특성을 보다 정교하게 반영한 이미지 생성 기술을 선보이겠다”고 말했다.


변상근 기자 sgbyun@etnews.com

브랜드 뉴스룸