단독네이버 독자 AI 논란...“정부 '해외 파생 모델 사용불가' 사전안내 있었다”

中 큐원의 '비전 인코더' 활용
업계 “외부모델 금지 안내받아”
평가단서 명확한 기술검증 필요

Photo Image
독자 AI 파운데이션 모델 프로젝트 최종 5개 정예팀 'K-AI' 앰블럼. ⓒ과학기술정보통신부

네이버클라우드의 독자 인공지능(AI) 파운데이션 모델 개발에 중국 알리바바 AI 모델인 큐원의 '비전 인코더'를 썼다며 논란이 불거진 가운데, 우리 정부가 독자 AI 모델 개발에 앞서 기업에 인코더 등 외부 모델 활용 불가 방침을 안내했던 것으로 확인됐다.

네이버클라우드가 5개 컨소시엄 중 유일하게 해외 인코더와 가중치를 활용한 상황을 고려, 형평성 담보를 위한 명확한 기술 검증이 요구된다는 지적이다.

8일 업계에 따르면 복수의 참여 기업은 지난해 독자 AI 모델 선정평가·개발에 앞서 과학기술정보통신부 등으로부터 모델 개발에 해외 오픈소스를 활용할 수 없다는 지침을 받았다. 발표평가 후 1차 평가까지 네 달여 밖에 남지 않은 물리적 한계를 고려한 문의였지만 수용되지 않았다.

업계 관계자는 “학습 데이터를 압축·변환하는 기술인 인코더나 AI 연산에 활용되는 가중치 등 오픈소스를 활용하면 개발 시간을 단축할 수 있어 사용 가능 여부를 문의한 것”이라며 “정부 측은 독자 AI 개발 목적상 외부 모델 도움 없이 자력 개발해야 한다는 취지로 회신했다”고 밝혔다.

사실상 외부 인코더와 가중치를 포함한 해외 모델을 활용할 수 없게 안내했다는 것이다. 이같은 방침은 '해외 AI 모델의 파인튜닝(미세조정) 등을 통한 파생형 AI 모델 개발은 독자 AI 모델로 간주되지 않는다'는 과기정통부의 '공모안내서에 대한 명기사항 안내' 공지에서도 나타난다는 게 경쟁사들 입장이다.

Photo Image
지난해 7월 과학기술정보통신부의 '독자 AI 파운데이션 모델' 프로젝트 해외 AI 모델 활용 관련 공지 갈무리.

또 전문가 평가기준에서도 독자 AI 모델 개발에 외부 모델 활용을 허용하지 않고 있다.

전자신문이 확인한 1차 평가기준은 △당초 계획 대비 충실도 △컨소시엄 참여사 간 협력 △기술 혁신성·우수성·차별성·안정성·실용성 △적용 가능성 △개발 성과 달성도 △향후 개발 계획에 관한 실현 전략 △국내 AI 생태계 파급 및 기여 효과 △글로벌 파급력 등 20개 내외다.

대다수 컨소시엄은 이러한 평가기준이 정부의 외부 모델 활용 금지 방침으로 보고 있다. 인코더 등 오픈소스 활용을 허용했다면 모델을 '프롬 스크래치'로 자체 개발한 다른 컨소시엄과 차등을 위한 평가지표가 있어야 한다는 의미다.

과기정통부 관계자는 “해외 오픈소스 모델을 사용하면 안된다는 방침은 명확하나 어디까지 해외 모델 활용으로 봐야할지는 해석의 영역”이라며 “기술 차별성 등 현재 평가기준으로 독자성을 가릴 수 있는 만큼 국내외 전문가로 꾸려진 평가단이 검증해낼 것”이라고 말했다.

네이버클라우드는 AI 파운데이션 모델 내에서 오픈소스를 활용하면 안된다는 지침이 없어 '큐원 2.5'의 가중치와 인코더를 전략적으로 활용했다는 입장이다. 정부 지침 자체가 선명하지 않았다는 취지로 풀이된다.

네이버클라우드 주장대로 옴니모달에 외부 인코더 활용은 세계적 흐름이라는 시각이 있다고 해도, 다른 모델의 가중치를 활용한 AI 모델 개발은 독자성에 의혹을 낳는다는 게 중론이다. 외부 가중치를 활용하면 연산 성능을 단시간 내 극대화할 수 있어 정부가 금지한 파인튜닝의 일종으로 볼 수 있다는 것이다.

KAIST 한 교수는 “다른 모델 가중치를 가져온 게 논란이 된 만큼 철저한 검증이 필요하다”면서 “네이버클라우드 모델 성능이 큐원을 압도하면 자체 기술을 적용한 독자 AI로 볼 여지가 있지만, 두 모델 성능이 비슷하다면 차용 논란에서 자유롭기 어렵다”고 말했다.

한편 과기정통부는 이르면 오는 12일 독자 AI 모델 사업자를 5개에서 4개로 압축해 발표할 예정이다.


박종진 기자 truth@etnews.com

브랜드 뉴스룸