ICT 시사용어
쉽게 배우는 시사상식. ICT 시사용어에서 쉽고 편리하게 만나보실 수 있습니다.
프롬 스크래치[from scratch]
프롬 스크래치(from scratch) 방식은 데이터 수집부터 아키텍처 설계, 학습 알고리즘, 데이터 처리에 이르는 모든 과정을 독자적으로 수행한다. 기존 다른 선행 모델의 코드를 참고하지 않는다. 이는 오픈소스 모델을 가져와 미세조정(파인튜닝)하거나 사전학습(프리트레이닝)하는 방식과 구분된다.
프롬 스크래치 방식은 초기 구축에 많은 비용과 리소스가 소요되지만 특정 기업이나 국가의 고유한 데이터를 바닥부터 학습시킬 수 있어 AI 소버린확보를 위한 필수 요건으로 꼽힌다.
정부가 추진 중인 2000억원 규모 '독자 AI 파운데이션 모델' 프로젝트와 맞물려 프롬 스크래치 기준에 대한 논쟁도 발생했다.
업스테이지의 경우 '솔라 오픈 100B' 모델이 중국 지푸AI의 GLM 계열 모델에서 파생됐을 가능성이 있다는 의혹이 제기되며 검증 도마 위에 올랐다.
업스테이지가 학습 추적 로그와 중간 체크포인트를 공개하며 논란은 일단락됐다. 하지만 소버린 AI 실현을 위한 프롬 스크래치의 명확한 기준을 정립해야 할 필요성이 제기됐다.
독자 파운데이션 모델 프로젝트 심사 역시 단순 성능 지표를 넘어 학습 데이터 계보와 체크포인트 검증 등 기술적 투명성이 핵심 쟁점으로 떠올랐다.