IBM이 최근 메타에서 발표한 '라마3.1'과 미스트랄 AI에서 발표한 '미스트랄 라지 2' 등 최신 오픈소스 거대언어모델(LLM)을 왓슨x.ai에서 제공한다고 발표했다.
왓슨x 사용 기업들은 IBM 그래니트, 라마 3.1, 미스트랄 라지 2 등 최고 성능의 오픈소스 인공지능(AI) 모델을 맞춤화해 사용할 수 있다.
이번에 발표된 라마 3.1은 각각 80억개(8B), 700억개(70B), 4050억개(405B) 매개변수를 가진 오픈소스 생성형 AI 모델로 구성됐다.
특히 현재 가장 크고 강력한 오픈소스 언어 모델로 평가받는 라마 3.1-405B 모델은 한번에 처리할 수 있는 문맥 길이가 토큰 8192개에서 12만8000개로 16배 늘어났다. 이는 약 8만5000개 영어 단어에 해당한다.
오픈AI의 'GPT-4o'와 같은 시장에서 가장 우수한 독점적 모델과 독해력, 코드생성, 학부 수준 지식 분야등 경쟁에서도 뒤지지 않는 성능을 보여준다.
강력한 성능을 제공하는 405B 모델은 AI 사전 학습이나 미세 조정을 위한 합성 데이터 생성, 더 작은 모델로 만드는 지식 증류 같은 작업에도 사용할 수 있다.
1230억개의 매개변수를 가진 미스트랄 라지2는 코딩과 수학 부문에서 뛰어난 성능을 발휘한다. 80가지가 넘는 코딩 언어를 지원하며 오픈AI의 GPT-4o, 앤트로픽의 '클로드3 오푸스', 메타 라마 '3.1 405B' 같은 최첨단 모델과 동등한 수준의 성능을 제공한다.
향상된 추론 능력으로 환각이나 그럴듯하게 들리는 거짓 답변들을 최소화했다.
IBM 왓슨x는 고객의 용도, 목적, 가격, 성능 등 최적의 균형을 가진 적합한 AI 모델을 선택해 각 기업에 맞게 구현을 지원한다.
박두호 기자 walnut_park@etnews.com