
AI 기술의 글로벌 경쟁력이 중요해지면서 한국적 AI의 품질 확보가 핵심 과제로 부상하고 있다. 20일 서울 코엑스에서 열린 'SOTEC 2025'에서 박재형 KT 상무는 '한국적 AI, LLM 품질 및 Eco 협업'을 주제로 발표를 진행했다.
박 상무는 “한국어 AI 모델의 신뢰성과 품질을 높이기 위해서는 데이터의 투명한 이력 관리와 편향성 최소화가 필수적”이라며 “표준화된 데이터 관리와 모델 평가가 중요한 역할을 한다”고 설명했다. 그는 AI 모델이 학습하는 모든 데이터가 투명하게 관리되고, 편향성이 제거된 학습이 이루어져야만 한국적 AI가 글로벌 경쟁력을 확보할 수 있다고 주장했다.
발표에서는 한국어 AI 모델의 신뢰성을 높이기 위한 데이터 리니지(Data Lineage) 전략이 소개됐다. 데이터 리니지는 데이터가 생성되고 처리되는 모든 과정을 추적하여 관리하는 기술로, 데이터의 출처와 변경 사항을 명확하게 파악할 수 있다. 이를 통해 중복된 도메인 식별, 데이터 편향도 점검, 안전한 데이터 서빙이 가능하다고 박 상무는 설명했다.
또한, AI 모델 학습 과정에서 도메인 분석(Domain Analysis)의 중요성을 강조했다. 도메인 체계를 정의하고, 세부 도메인 분류 표준화를 통해 데이터의 불균형을 조정하고, 부족한 도메인은 추가 확보하여 학습의 균형을 맞추는 전략을 소개했다. 이를 통해 데이터의 다양성과 신뢰성을 확보할 수 있다고 설명했다.
박 상무는 “한국적 AI가 세계적 수준의 품질을 유지하려면, 도메인 체계 분석과 데이터 리니지 구축이 필수적”이라며 “데이터 품질 관리를 위한 체계적인 시스템 구축이 이루어져야 한다”고 강조했다. 또한 “표준화된 데이터 관리 체계를 구축할 때 한국적 AI가 세계 시장에서 경쟁력을 확보할 수 있다”고 덧붙였다.
김정희 기자 jhakim@etnews.com



















