
직원들의 마우스 움직임과 키 입력 기록까지 추적하는 등 빅테크 기업들의 인공지능(AI) 학습용 데이터 확보 경쟁에 불이 붙었다.
21일(현지시간) 로이터에 따르면 메타는 AI 모델을 고도화하기 위해 자사 직원들이 컴퓨터와 상호작용하는 행동 데이터를 수집하는 소프트웨어(SW)를 설치하고 있다. '모델 역량 이니셔티브(MCI)'로 불리는 이 SW는 업무 관련 애플리케이션(앱)과 웹사이트에서 실행된다. 직원들의 마우스 움직임, 클릭, 키 입력 등을 추적하고, 화면에 나오는 콘텐츠도 캡처한다.
메타가 이 SW를 만든 목적은 사람과 컴퓨터의 상호작용 데이터를 AI 에이전트에 학습시키는 것이다.
메타는 “컴퓨터를 이용해 일상적인 작업을 수행할 수 있도록 돕는 에이전트를 만들기 위해선 실제로 사람들이 실제로 컴퓨터와 상호작용하는 예시가 필요하다”면서 “특정 애플리케이션에서 이 같은 입력 데이터를 포착하는 내부 도구를 도입할 예정”이라고 말했다.
그러면서 “민감한 콘텐츠를 보호하기 위한 안전장치를 마련했고, 데이터는 모델 학습 외 다른 목적으로 사용되지 않는다”고 설명했다.
AI 학습용 데이터의 가치가 높아지자, 폐업 스타트업의 업무 데이터를 거래하는 시장도 등장했다.
미국 폐업 스타트업 정리 서비스 기업심플클로저는 최근 폐업 스타트업의 소스코드를 거래하는 '에셋 허브'를 출시했다. 이메일, 슬랙, 지라(Jira) 티켓, 구글드라이브 등 운영 문서를 포함한 '워크스페이스 데이터'도 거래할 수 있다. 판매 가능한 데이터 선별과 가치평가, 개인식별정보 제거 작업을 지원한다는 게 회사 설명이다.
AI 학습용 데이터는 AI 서비스 성능을 좌우하는 핵심 요소다.
차세대 AI 에이전트 'AI 탭'을 개발 중인 네이버도 학습 데이터 확보에 집중하고 있다. 올 상반기 출시 예정인 AI 탭은 쇼핑·플레이스·페이 등 네이버 서비스를 연결해 정보 탐색을 넘어, 실제 행동까지 이어지도록 돕는 AI다. 네이버는 AI 탭 고도화를 위해 블로그, 카페 등 이용자제작콘텐츠(UGD)와 자체 데이터뿐만 아니라, 외부 제휴를 통한 데이터도 확보할 계획이다.
네이버 관계자는 “AI 탭은 네이버 내부 활동 데이터와 대화 맥락을 바탕으로 판단과 실행을 할 것”이라면서 “현재 갖고 있지 않은 여러 데이터들도 외부 제휴 등을 통해 추가적으로 확보하기 위한 노력을 진행할 예정”이라고 했다.
현대인 기자 modernman@etnews.com



















