IBM이 생성형 인공지능(AI)으로 발생한 모든 저작권 문제를 책임지겠다고 발표했다. AI 학습에 사용한 데이터셋도 공개하겠다고 밝혔다.

뉴욕타임스는 28일(현지시간) IBM이 고객사가 느끼고 있는 불안감을 낮추기 위해 저작권 문제에 공격적인 모습을 보였다고 보도했다.

마이크로소프트도 9월 초에 생성 AI 사용자가 저작권 문제에 엮이면 회사가 모든 책임을 지겠다는 면책 조항을 내걸은 바 있다. 어도비나 셔터스톡 등 이미지 생성 AI 기업도 비슷한 약속을 했다.

IBM은 여기에 더해 처음으로 학습에 사용한 데이터셋까지 모두 공개하겠다고 밝혔다.

IBM은 '왓슨x' 플랫폼에서 사용할 수 있는 대형언어모델(LLM) '그래니트'를 비롯해 △오픈소스 LLM 등 파운데이션 모델 △데이터 생성기와 데이터 관리 도구 △미세조정 도구 △벡터 데이터베이스 등을 선보였다.

IBM의 왓슨x 서비스는 기업 전용 서비스다. 범영 생성AI 모델이 공개적인 데이터를 학습했다면, 기업 전용 AI는 저작권 문제가 해결된 전문 데이터를 주로 사용한다.

롭 토마스 IBM 부사장은 “데이터 학습 범위가 줄면 정확도는 향상된다”라며 “기업용 AI 시장에서는 정확성이 크기보다 훨씬 더 중요하다”고 말했다.

Photo Image
IBM Ci

박두호 기자 walnut_park@etnews.com