
앤트로픽이 한층 진화한 인공지능(AI) 모델을 선보였어요.
바로, 오퍼스 4.6(Opus 4.6)이에요.
앤트로픽은 자사의 AI 챗봇 '클로드'의 최상위 모델 오퍼스 4.6을 출시한다고 5일(현지시간) 밝혔습니다.
오퍼스 4.6에서 가장 눈에 띄는 기능은 '에이전트 팀'의 도입이에요. AI 에이전트를 하나가 아니라 여럿 부릴 수 있는 기능입니다.
하나의 에이전트가 작업을 순차적으로 수행하던 방식에서 벗어나, 여러 에이전트가 역할을 분담해 동시에 작업하고 서로 협력하는 구조라고 회사 측은 설명했습니다.
오퍼스 4.6은 한 번에 입력할 수 있는 데이터양을 100만 토큰(AI 모델의 입출력 단위)으로 늘려, 책 수십 권 분량의 데이터를 한꺼번에 처리할 수 있게 했어요.
또 마이크로소프트(MS)의 엑셀과 파워포인트에 클로드를 통합해 AI가 데이터 분석부터 프레젠테이션 제작까지 맡아주는 기능도 추가했어요.
앤트로픽이 공개한 벤치마크 점수를 보면 오퍼스 4.6은 코딩뿐 아니라 지식 노동 분야에서도 경쟁사들을 앞섰는데요.

사무업무 능력을 평가하는 'GDPval-AA' 지표에서는 1천606점을 기록해 오픈AI의 GPT-5.2(1천462점)와 구글 제미나이3 프로(1천195점)를 넘어섰습니다.
오픈AI가 지난해 공개한 정보 검색 능력을 측정하는 벤치마크 '브라우즈컴프(BrowseComp)'에서도 오퍼스 4.6은 84%의 성과를 보여 GPT-5.2(77.9%)·제미나이3 프로(59.2%)를 능가했어요.
코딩 능력을 측정하는 'SWE-벤치 베리파이드' 점수는 80.8%로 이전 버전의 80.9%보다 소폭 떨어졌지만, 여전히 GPT-5.2나 제미나이3 프로보다는 높았습니다.
분야별 전문가급 문제들을 모아 '인류의 마지막 시험'으로 불리는 HLE 점수도 현존 AI 모델 가운데 처음으로 도구 미사용 기준 점수 40%를 기록했어요.
앤트로픽의 제품 총괄 스콧 화이트는 미국 정보기술(IT) 전문매체 테크크런치에 “클로드 코드는 개발자가 아닌 사람들도 작업 수행 능력만 보고 많이 이용하고 있다”며 자사 AI 모델 이용자가 제품관리자와 금융분석가 등 다양한 분야에 걸쳐 있다고 설명했습니다.
최성훈 기자 csh87@etnews.com


















