
지금 우리에게 필요한 것은 '무엇을 할 것인가'에 대한 명확한 답이다.
인공지능(AI) 기술의 변화 속도는 일 단위로 빨라지고 있고, 경쟁국들은 자국 산업과 행정 현장에 특화된 AI 결합 전략을 구체적인 실행 단계로 옮기고 있다. 한국 역시 범용 거대언어모델(LLM) 역량을 확보하는 데만 머물러서는 안 된다. 이를 토대로 산업 현장과 맞물려 실제로 작동하는 월드파운데이션모델(WFM) 역량도 확보해나가야 한다. WFM은 물리적·절차적 세계를 시뮬레이션하고 최적안을 찾아내는 모델로, LLM이 언어를 통해 문제를 정의·설명하고 이해관계자와 소통하는 과정과 결합될 때 진가를 발휘한다. 이 결합이 제대로 작동하려면, 정부·산업·학계·공공이 함께 움직이는 명확한 로드맵이 필요하다. 이제 그 다섯 가지 방향을 제시한다.
첫째, 범용 LLM 경쟁의 기준을 바꿔야 한다.
지금까지의 경쟁은 파라미터 수, 학습 데이터 규모, 연산량과 같은 '스펙 지표'에 치우쳐 있었다. 그러나 상향평준화가 진행된 지금은 실제 업무 환경에서 얼마나 안정적이고 효율적으로 작동하는지가 더 중요하다. 평가 기준은 벤치마크 시험지가 아니라 정확도·지연·처리량·비용·오류 책임성 등 '실사용 지표'로 전환해야 한다.
둘째, WFM 국가 시범사업을 서둘러야 한다.
특히 조선·반도체·전력 분야는 데이터와 공정 노하우가 이미 축적돼 있고, 최적화가 곧 비용 절감과 직결되는 분야다. 조선소에서는 LLM이 고객 요구와 규제 조건을 분석해 설계 의도를 문서화하고, WFM이 연료 소모·접안 가능성·안전성에 미치는 영향을 시뮬레이션할 수 있을 것이다. 반도체 파운드리에서는 수율 저하가 감지되면 LLM이 공정 로그를 요약하고, WFM이 파라미터-수율 상관관계를 시뮬레이션해 최적 파라미터를 제안하면, 불량률이 감소하고, 생산량이 늘어난다.
셋째, 평가·인증 체계를 정례화해야 한다.
속도와 비용뿐 아니라, 시뮬레이션과 실제 결과의 재현성, 규제 적합성, 보안성까지 포함하는 종합 인증 기준을 마련해야 한다. 예를 들어, 국가 인증기관이 조선 분야의 디지털트윈 결과를 실제 운항 데이터와 비교해 95% 이상 일치하면 '레벨 A' 인증을 부여한다. 이렇게 인증된 솔루션은 조달 절차에서 즉시 발주가 가능해지고, 해외 수주에서도 강력한 신뢰를 얻게 된다.
넷째, 인력과 조직을 문제 중심으로 재편해야 한다.
AI 연구자와 현장 엔지니어가 분리된 구조로는 WFM의 잠재력을 충분히 끌어낼 수 없다. 동일한 목표를 공유하는 상설 스쿼드가 필요하며, 대학에는 산업 문제 기반 학위 트랙을 신설해야 한다.
다섯째, 공공 부문이 먼저 시범을 보여야 한다.
민간 확산의 전제 조건은 신뢰다. 민원·복지·의료 자원 배분 같은 공공 AX 영역에서 LLM+WFM을 적용해 사회적 효용을 먼저 입증하면, 민간 확산의 신뢰 기반이 단단해진다. 예를 들어, 감염병 확산 시, LLM이 환자 수요와 병상 현황을 분석하고 WFM이 의료진·장비·이송 경로를 포함한 최적 배분 시나리오를 제시하면, 구급차 뺑뺑이 문제도 해결해나갈 수 있다.
물론, GPT-5는 뛰어나다. 그러나 다음 도약이 '더 큰 LLM'에서 자동으로 오지는 않는다. 언어(LLM)가 세계(WFM)와 현장(버티컬 AI)에 깊이 닿을 때, 생산성의 단위가 바뀌는 변화가 시작된다. 한국은 깊은 산업 데이터, 높은 디지털 침투도, 숙련된 엔지니어라는 조건을 동시에 갖춘 드문 나라다.
우리의 길은 분명하다. 작동하는 것을 빨리 만들고 현장에서 학습할 것, 데이터 등급과 상호운용의 규칙을 먼저 깔 것, 주권 코어와 개방 엣지의 균형으로 속도와 신뢰를 동시에 잡을 것. 늦었지만 늦지 않았다. 우리가 범용 LLM을 발판 삼아 WFM과 결합하고, 산업 데이터로 수직적 경쟁력을 완성한다면, 한국은 모델을 수입해 쓰는 나라가 아니라 문제를 정의하고 해결 방식을 수출하는 나라가 될 수 있다. 지금이 그 전환의 창이다.
이승현 디지털플랫폼정부위원회 인공지능플랫폼 혁신국장 epoko77@korea.kr


















