[김경환 변호사의 IT법] 〈9〉AI 개발 계약은 SW 개발 계약과 달리 접근해야 한다

Photo Image
김경환 법무법인 민후 변호사

많은 기업이 외부 전문 인공지능(AI) 개발사와 손을 잡고 프로젝트를 진행하는 과정에서 소프트웨어(SW) 개발 계약서를 그대로 활용하나, AI 개발은 일반적인 SW 외주 개발과 본질적으로 구조가 다르다. 일반 SW가 기획된 기능에 맞추어 소스코드를 작성하는 일방향적 작업이라면, AI 개발은 원천 데이터의 정제, 학습 알고리즘의 결합, 그리고 반복적인 학습을 통해 최적의 가중치(Weight)를 찾아내는 복합적인 프로세스다.

AI 개발 계약은 크게 네 가지 요소, 즉 기존 보유 기술(Background IP), 투입 데이터, 최종 학습 완료 모델(가중치), 그리고 파생 기술로 쪼개서 접근해야 한다. 이를 통해서, 개발사의 범용 엔진과 기본 알고리즘에 대한 소유권은 인정해주되, 우리 기업이 제공한 핵심 도메인 데이터와 이를 통해 학습된 '최종 특화 모델(Customized Model)'의 소유권 및 독점권은 반드시 기업에 귀속시켜야 한다. 특히 AI의 성능을 좌우하는 파라미터에 대한 독점적 접근 및 수정 권한이 기업에 귀속됨을 계약서상에 명확히 컴포넌트 단위로 분리해 명시해야 한다.

두 번째로 주의해야 할 점은 '데이터의 가공 및 피드백 효과'에 대한 권리 확보다. 기업이 원천 데이터를 개발사에 제공하면, 개발사는 이를 AI가 인식할 수 있도록 정제하고 라벨링하는 과정을 거친다. 이 가공 데이터는 그 자체로 엄청난 자산 가치를 지닌다. 또 개발 과정에서 우리 데이터를 학습한 AI가 보여주는 오류 수정 프로세스나 고도화된 방법론은 개발사에 일종의 '학습 효과'를 제공한다. 기업 입장에서는 우리가 제공한 데이터 덕분에 개발사의 기술력이 업그레이드되는 셈이다. 만약 이를 방치하면 개발사는 우리 데이터로 쌓은 노하우를 활용해 고스란히 경쟁사의 AI 시스템을 만들어줄 수 있다. 이를 막기 위해 계약서에 '본 프로젝트를 위해 가공된 데이터의 소유권은 발주사에 있으며, 개발사는 본 계약 목적 외에 이를 다른 학습에 재활용하거나 제3자에게 노출할 수 없다'는 강력한 보안 및 재사용 금지 조항을 삽입해야 한다. 아울러 계약 종료 후 일정 기간 동안 동종 업계의 경쟁사에게 유사한 AI 모델을 개발·납품하는 것을 제한하는 '경쟁 금지 기간'을 설정하는 것도 필수적이다.

세 번째는 '오픈소스 라이선스'와 '제3자 권리 침해'에 대한 리스크 관리다. 현재 대부분의 AI 개발은 오픈소스 프레임워크나 기존에 공개된 거대언어모델(LLM)을 기반으로 변형 및 파인튜닝하는 방식으로 이뤄진다. 그런데 오픈소스 라이선스 중에는 전체 소스코드를 대중에게 의무적으로 공개해야 하는 독소 조항(GPL 등)이 포함돼 있는 경우가 많다. 이를 모른 채 개발사가 만든 AI를 기업의 핵심 서비스에 탑재했다가, 추후 저작권 소송에 휘말리면 기업 이미지와 매출에 치명적인 타격을 입는다. 따라서 계약서에 '개발사는 본 결과물에 사용된 모든 오픈소스의 목록과 라이선스 조건을 발주사에 사전 고지해야 하며, 상용화에 제약이 없는 라이선스만을 사용해야 한다'는 담보 조항을 넣어야 한다. 더불어 개발사가 AI를 학습시키는 과정에서 무단으로 제3자의 저작물을 크롤링해 사용하여 발생할 수 있는 저작권 침해 소송에 대비해, '제3자의 지식재산권 침해 시 모든 법적 책임과 손해배상은 개발사가 전적으로 부담한다'는 면책 조항을 촘촘하게 구성해야 한다.

기술적 메커니즘에 대한 이해 없이 기존의 일반 SW 외주 계약서 양식을 그대로 재활용하는 것은 기업을 법적 공백 상태에 노출시키는 것과 다름없다. AI의 구성 요소를 명확히 분리하는 정밀한 계약 설계만이 기술 도입의 시너지를 극대화할 수 있다.

김경환 법무법인 민후 변호사

브랜드 뉴스룸