
국내 주요 기업·기관 C레벨들은 인공지능(AI) 강국 실현을 위해 시급하게 해결해야할 현안으로 고품질 데이터를 최대한 확보해야 한다고 답했다. 데이터를 모으고 활용할 때 양보다 질을 우선해야 하며 양질의 데이터 확보를 가로막는 규제 개선 필요성도 제기했다.
전자신문이 창간 43주년을 맞아 진행한 설문조사 결과 국내 기업·기관 110개사 C레벨 임원은 데이터 확보 과정에서 '데이터 양 또는 품질 부족'(31.8%), '개인정보보호법 등 규제 준수'(29.1%), '데이터 가공·정제에 투입되는 시간'(28.2%) 등의 문제로 어려움을 겪는다고 답변했다.
AI 학습용으로 활용할 수 있는 양질의 데이터가 필요하다는 의미다. 가공·정제되지 않은 로(raw)데이터 등 양만 많으면 온전한 가치를 발휘하지 못할 것이라는 의미다. 데이터 수집과 활용에 대기업도 적지 않은 비용과 시간을 투입하지만 정작 고품질 데이터 확보에 애로사항이 있는 것으로 풀이된다. 앞선 설문에서 데이터 확보와 AI인재확보는 둘다 모두 주요 애로 사항으로 지적됐지만, 인재양성은 시간이 걸리는 만큼 데이터 확보해결은 더욱 시급한 과제로 지목됐다. 정부의 규제 완화 등 제도 완화로 그나마 빠르게 해소할 수 있는 어려움이라는 것이다.
로봇·자율주행 등 미래 전략산업에 반드시 필요한 '피지컬 AI'를 고도화할 수 있는 시각언어행동(VLA) 모델을 확보하기 위한 데이터 생태계 조성 필요성도 제기됐다. VLM은 이미지와 영상 처리능력을 강화한 AI 모델로 피지컬 AI 개발에 반드시 필요한 기반 모델이다.

피지컬 AI를 산업 현장에서 활용하기 위해 VLA 학습을 위한 산업용 데이터가 필요한데 확보가 어려운 상황이다.
시방서나 공정 불량, 설계도, 도면 등 데이터가 기업의 핵심 기술이 반영된 영업비밀에 해당되기 때문이다. 외부에 공개할 수 없는 기밀 데이터로, AI기업이 VLA 모델 학습용으로 충분히 확보하기에 한계가 있다. 또 제조기업 스스로 VLA 모델을 개발하고 학습하는 데도 어려움이 따른다.
정부와 산·학·연이 합심해 신뢰를 바탕으로 VLA 학습용 등 AI 고도화를 위한 학습용 데이터 생태계 조성이 필요한 이유다.
또 기업·기관 C레벨 임원은 데이터 정확성·신뢰성 부족 해결을 당면과제로 꼽았다. 미국과 중국이 앞서가고 있지만 신뢰할 만한 데이터를 토대로 충분히 경쟁력을 갖출 수 있게 생태계를 조성해달라는 요청이다. 또 글로벌 AI 강국으로 가기 위해 데이터 보안 중요하다는 전망도 냈다. 한 응답자는 “고품질 데이터도 기술 유출 없이 안전하게 활용할 수 있는 생태계 조성이 필요하다”고 설명했다.
경영자들은 정부 차원의 데이터센터 확보, 개인정보 관련 규제 개혁 등 기업 부담을 최소화해야 한다는 데 의견을 모았다. 자율주행 산업에서 개인 정보 관련 규제를 완화하는 방식으로 학습 목적 원본 데이터 확보 필요성도 강조됐다.


인재 확보 필요성도 중장기 과제로 제기됐다. 응답자의 56.4%가 AI 전문 인력 강화를 위해 '기업의 AI 인력 교육 무상 지원'과 'AI 전문 대학원 설립 확대' 등을 제안했다. AI 기술 경쟁력 확보에 있어 가장 큰 걸림돌은 전문 인력 수급이라고 응답했다.
AI 무상 교육과 AI 전문 대학원 확대로 고질적 인재난을 타파할 수 있을 것이라는 의견도 제시됐다. 일례로 LG그룹은 국내 최초로 교육부로부터 사내 AI 대학원 설치를 최종 인가받으며 AI 인력 확보에 적극 나서고 있는 상황이다.
우리나라에서 △외국인 비자 요건 완화 △유학 졸업생 취업 확대 △산업 현장 외국인 인력 투입 등 해외 첨단 인력을 유치해야 한다는 조언도 나왔다. 설문에 참여한 한 전문가는 “양질의 데이터 확보, 전문 인력 양성 등 생존을 위해 AI 시대에 대응해야 한다”며 “AI를 통해 기본 데이터를 학습화할 필요가 있으며 AI 관련 미래 산업을 키우며 기업의 사업화 기회를 만들어줘야 한다”고 말했다.
김지웅 기자 jw0316@etnews.com





















