영국이 AI 훈련에 활용되는 저작물 관련 규제에 착수했다.
영국 정부는 17일(현지시간) 기술 기업들이 저작권이 있는 콘텐츠를 AI 모델 훈련에 사용할 때 필요한 법적 틀을 마련하기 위한 논의를 시작한다고 밝혔다.
창의산업과 AI 개발자들이 지식재산권(IP)이 어떻게 확보되고 사용되는지에 대해 더 명확히 이해할 수 있도록 돕는 것이 이번 논의의 목표다. 영국 지식재산청, 과학혁신기술부, 디지털·문화·미디어·스포츠부(DCMS)가 모두 참여한다.
거대언어모델(LLM) 등 생성형 AI 개발과 훈련에서 방대한 데이터를 활용하는 것은 필수적이다. 이에 저작물에 대한 보다 명확한 지침과 보호조치가 시급하다는 진단이다.
먼저 영국 정부는 상업적 목적으로 사용될 때 AI 훈련에 대한 부분은 저작권법의 예외로 두고 권리 보유자가 콘텐츠 사용을 통제할 수 있도록 하는 방안을 제안하겠다는 방침이다.
둘째로 창작자가 AI 모델 제작자에게 콘텐츠 활용에 대한 라이선스를 부여하고 보상을 받을 수 있도록 지원하고, AI 개발자에게는 모델 학습에 대한 자료의 명확성을 요구한다.
또 AI 모델 개발자가 자신의 콘텐츠에 AI 학습이 언제 어떻게 사용됐는지 이해할 수 있도록 모델 학습 데이터셋과 학습방법을 보다 투명하게 공개하도록 요구하는 방안도 고려하고 있다.
피터 카일 영국 과학혁신기술부 장관은 “현재의 AI 및 저작권 프레임워크는 우리 창의산업이나 AI 부문이 세계 무대에서 경쟁하는 데 도움이 되지 않는 것이 분명하다”며 “저작권법이 AI에 어떻게 적용되는지에 대한 불확실성을 해소하고 균형 잡힌 제도 마련을 통해 AI 부문과 창의산업에 지속적 성장을 촉진할 것”이라고 말했다.
영국 정부의 이러한 노력에도 저작권자의 권리 보호와 데이터 투명성에 대한 기준, 요구사항을 보다 구체적으로 만들기 위해선 넘어야 할 산이 많다는 지적이다. 당장 영국 정부의 이러한 발표가 나온 직후 현지 일부 크리에이터와 출판사들은 기술 기업에 사실상 길을 열어주는 것이라고 반발하는 상황이다.
AI 분야에서 저작권이 있는 자료 활용을 둘러싼 갈등과 법적 다툼은 늘어나고 있다.
뉴욕타임즈는 오픈AI와 마이크로소프트가 AI 학습에 자사 기사를 대량 활용했다고 소송을 제기했다. 이미지 배포 플랫폼 게티이미지는 영국에서 생성형 AI 기업인 스태빌리티AI가 자사 스태블 디퓨전 AI 모델 훈련을 위해 웹사이트에서 수백만장의 이미지를 스크래핑했다며 소송을 제기했다.
김명희 기자 noprint@etnews.com