구글, AI 비서·검색 기능 선봬…제미나이 생태계 확장

Photo Image
구글이 발표한 주요 AI 서비스. 순다르 피차이 구글 최고경영자가 13일(현지시간) 구글 I/O 2024에서 키노트를 하고 있다.

구글이 인공지능(AI)을 탑재한 검색 엔진과 이용자 개인 비서 역할을 수행하는 AI를 공개했다.

구글은 13일(현지시간) 구글 연례 개발자 회의(I/O)에서 AI와 관련한 새로운 기능을 대거 선보였다.

먼저 구글은 △검색 △포토 △워크스페이스 △안드로이드 등 자사 제품 전반에 제미나이를 탑재한다. 'AI 개요(AI Overview)'를 통해 구글 검색 결과에 대한 빠른 요약과 관련 링크를 제공, 이용자가 효율적으로 정보를 탐색하고 복잡한 질문에 대한 답을 찾도록 지원한다.

AI는 구글 포토에 저장된 사진 속 정보를 분석해 질문에 답변하거나 이메일을 요약하고 첨부된 PDF 파일까지 분석하기도 한다. 핵심 내용과 해야 할 일을 추론해 안내하는 기능도 있다. 긴 회의 녹화본 주요 내용을 요약하거나 특정 이메일에 대해 답장을 대신 작성하는 등 다양한 작업을 수행한다.

'프로젝트 아스트라'로 불리는 생성형 AI 비서 기능도 발표했다. 인간처럼 보고 듣고 배우는 미래형 AI 에이전트다. 텍스트, 이미지, 영상, 음성 등 다양한 정보를 이해하고 처리하는 멀티모달 기술이 탑재됐다. 모바일 기기나 스마트 안경을 통해 언제 어디서든 전문적인 도움을 제공할 계획이다.

구글은 제미나이와 자연스럽게 대화할 수 있는 '제미나이 라이브'도 출시할 예정이다. 제미나이가 응답하는 도중에 질문을 던지는 등 실제 일상 속 대화처럼 자유롭게 소통이 가능하다.

아울러 지난 2월 공개한 멀티모달 AI 제미나이 1.5프로의 한국어 버전을 출시한다. 구글은 제미나이 1.5의 데이터·알고리즘 개선을 통해 코드 생성, 논리적 추론·계획, 멀티턴 대화, 오디오 및 이미지 인식 성능을 향상시켰다. 100개의 이메일을 수 초 만에 요약하고 1시간 분량의 동영상을 처리할 수 있다.

텍스트 투 이미지 AI인 이마젠의 최신 버전인 '이마젠3'도 공개했다. 자연어와 프롬프트의 의도를 이해해 사실적인 이미지를 생성한다. 텍스트를 입력하면 1분 이상의 영상을 만들어주는 AI 모델 비오(Veo)도 선뵀다.

이와 함께 안드로이드 서클 투 서치 기능을 업그레이드 했다. 학습 특화 모델 '런LM(LearnLM)'이 적용돼 학생이 과제나 학습 중 막히는 부분을 앱 전환 없이 바로 해결할 수 있다. 수학이나 물리 문제 풀이 과정에서 어려움을 겪을 때 서클 투 서치를 이용하면 단계별 풀이 가이드를 확인할 수 있다.

책임감 있는 AI 정책도 펼친다. 'AI 기반 레드팀 기술'을 도입한다. 알파고의 게임 기술을 활용해 AI 에이전트 간 경쟁을 통해 레드팀 기능을 강화한다. 이를 통해 모델 안전성과 신뢰성을 제고할 수 있다. AI로 생성한 콘텐츠를 식별하기 위해 신스ID의 워터마크 부착을 확장한다. 기존 이미지·음성 뿐만 아니라 텍스트와 영상에도 적용한다.

이 외에도 AI 전용 하드웨어인 텐서처리장치(TPU) '트릴리움'을 발표했다. 칩당 컴퓨팅 성능이 4.7배 향상될 수 있으며 클라우드 고객의 디지털전환(DX)를 지원하는 역할을 한다.

순다르 피차이 구글 최고경영자(CEO)는 “제미나이 생태계에 상상 가능한 AI의 모든 것을 담았다”며 “AI 혁신을 가속화해나갈 계획”이라고 말했다.


손지혜 기자 jh@etnews.com


브랜드 뉴스룸