Photo Image
CES 2023 개막 이틀째인 지난 2월 6일(현지시간) 미국 네바다주 라스베이거스 컨벤션센터(LVCC)에 마련된 구글 야외 전시관. 전자신문 DB.

인공지능(AI) 챗봇 경쟁이 치열하게 전개되는 가운데 구글의 '바드'(Bard)가 마이크로소프트의 '빙'(Bing)보다 기능이 떨어진다는 실망 섞인 평가가 나오고 있다.

23일(현지시간) 미국 경제매체 비즈니스 인사이더는 지난 20일 구글이 미국과 영국에서 일부 이용자들을 대상으로 바드에 대한 테스트를 진행한 결과 이 같은 평가를 받았다고 보도했다.

이번 테스트는 바드 출시를 예고한 지 약 한 달 반 만에 진행됐다. 앞서 MS가 빙 테스트를 시작한 것보다도 한 달 이상 늦은 셈이다.

시장에서는 비록 바드의 출시는 늦었어도 구글이 전 세계 검색 시장을 장악하고 AI 분야 선두주자인 만큼 챗GPT를 등에 업은 MS를 넘어설 것이란 기대가 있었다.

하지만 지난달 공개 시연 당시 오답을 내놓아 한 차례 실망감을 안겼다. 제임스 웹 우주망원경이 태양계 밖 행성을 처음 촬영한 망원경이라고 잘못 대답한 것이다. 태양계 밖 행성은 유럽남방천문대가 칠레에 설치한 거대망원경 ‘VLT’가 처음 찍었다. 구글 모기업인 알파벳의 주가는 하루 새 8% 급락했으며, 시가총액은 1000억달러(약 126조)가 증발하기도 했다.

아울러 이번 테스트에서도 이용자들이 실망감을 나타낸 것이다. 테크 유튜버 마르키스 브라운리는 자신의 트위터에 "오늘 구글 바드를 좀 이용해 봤는데 이런 말을 하게 될 줄은 상상도 못 했다"며 "(특정 채팅 기능에서) 빙이 구글의 바드를 훨씬 앞선다"고 썼다.

펜실베이니아대 와튼스쿨의 에단 몰릭 부교수는 "바드는 빙이나 GPT-4만큼 학습 도구로서 능력이 있어 보이지 않는다"면서 “시를 짓는 데에 바드는 경쟁자인 빙보다 많이 뒤처져 있다”고 평가했다.


시나 줄거리 같은 글짓기 외에 단어 퍼즐 게임에서도 평가는 좋지 않다. 게임 제작자들에 따르면 한 쌍의 단어가 무엇을 의미하는지를 맞추는 온라인 퍼즐 '투퍼 구퍼'(Twofer Goofer)에서 바드는 하나도 정답을 맞히지 못했다. 오픈AI가 최근 출시한 GPT-4가 96%, 인간이 82%의 정답률을 보인 것과는 비교되는 결과다.


전자신문인터넷 서희원 기자 (shw@etnews.com)