사람은 누구나 '생리적' '안전' '소속감과 애정' '존경' '자아실현' 다섯 가지 욕구를 경험한다. 이 다섯 가지 욕구는 우선 순위가 존재하고 첫 번째 단계 욕구가 만족돼야만 다음 단계 욕구가 나타난다. 모든 욕구 단계를 충족했을 때 비로소 정체성을 찾을 수 있다. 이는 현대 심리학자 중 가장 영향력 높은 아브라함 매슬로가 제시한 동기이론이다.
우리는 직업 활동을 통해 매슬로 동기이론을 매일 체험하고 있다. 매달 받는 급여로 생리적 욕구와 안전 욕구를 해소하고 있으며 주위 동료들로부터 소속감과 애정욕구를 충족하고 있다. 또 승진과 인지도 형성을 통해 존경욕구와 자아실현 욕구를 채워나가고 있기 때문이다.
직업의 사전적 의미는 생계를 유지하기 위해 자신의 적성과 능력에 따라 일정한 기간 동안 계속해 종사하는 일이다. 하지만 놀랍게도 직업이란 개념과 용어가 정의된 건 반세기가 채 되지 않는다.
최근 새롭게 각광받고 있는 직업군인 데이터 라벨러를 살펴보면 직업 탄생 과정이 잘 담겨있다. 데이터 라벨러는 인공지능(AI) 학습에 필요한 데이터를 수집하고 가공하는 데이터 라벨링 작업을 전문으로 하는 새로운 직업이다.
데이터 라벨러 등장은 AI시장 변화에서부터 시작됐다. 4차 산업혁명 시대를 맞아 핵심 기술인 AI와 데이터에 대한 시장의 관심이 높아지면서 경쟁력 확보를 위한 기술 고도화 중요성이 커졌다. 여기에 코로나19 이후 언택트와 디지털 대전환 가속화로 AI 기반 온라인 서비스가 시장 전반에 확대되기 시작했다. 4차 산업혁명과 언택트 그리고 디지털 대전환이 맞물리며 AI가 주인공으로 떠오른 것이다.
생산성과 효율성을 고려한 분업 과정도 겪었다. 하나의 AI 기술이 상용화될 때 가장 많은 시간을 필요로 하는 작업은 데이터 라벨링이다. 데이터 라벨링이란 AI 기술 고도화에 필요한 학습 데이터를 수집하고 가공하는 것으로, 전체 AI 프로젝트 소요시간 기준 70% 이상을 차지한다. 상용화 이후에도 머신러닝(ML) 알고리즘 34%는 최소 한달 이하 주기로 새로운 학습 데이터 제공이 필요하다.
시장 수요와 맞물려 데이터 라벨링을 전문으로 하는 기업이 등장하기 시작했고 자연스레 데이터 라벨러 수도 늘어나고 있다. 관련 업계에서는 국내에만 20만명 이상이 데이터 라벨링에 종사 중인 것으로 추정한다.
데이터 라벨러들 사이에서도 정확도 높은 데이터 확보를 위한 별도 분업이 진행 중이다. 데이터 수집과 가공은 물론 라벨링된 데이터 정확도를 검수하는 전문인력까지 등장했다. 데이터 라벨링 생산성과 효율성을 높이기 위한 분업 과정인 것이다.
전문성도 요구되는 상황이다. AI 기술이 고도화됨에 따라 적합하고 정교한 데이터 중요성이 높아진다. 의료, 법률, 어학 등 전문성을 갖춘 데이터 라벨러에 대한 시장 요구가 증가하고 있기 때문이다.
시장 요구에 맞춰 AI 학습 데이터 플랫폼 회사와 특정 분야 전문기업 업무협약 사례도 등장하고 있다. 최근 크라우드웍스도 50명 이상 전문의로 구성된 아셉틱과 업무협약를 체결하고 의료 분야 데이터 전문성을 강화했다.
이렇듯 데이터 라벨러 역시 직업의 탄생 과정을 모두 거치며 언택트 시대의 새로운 일자리 패러다임으로 자리 매김하고 있다. 최근에는 데이터 라벨러만을 위한 전문교육이 등장하고 민관 주도 일자리 창출까지 더해지며 사회적 관심도 높아지고 있다.
데이터 수요 증가에 따른 데이터 라벨러 수익도 크게 개선됐다. 최근 크라우드웍스의 데이터 라벨러 누적 지급 수익금은 30억원을 넘어섰다. 누적 지급 수익금 10억원을 달성한 지 불과 1년여 만에 3배 이상 증가했다.
AI 기술 고도화를 위해서는 사람 개입이 필수다. 사람의 삶을 윤택하게 하기 위해서는 고도화된 AI 기술이 필요하다. 데이터 라벨러가 개인의 정체성 확보를 위한 새로운 직업군을 넘어 국내 AI 시장 발전 초석을 다지는 주역으로 거듭나길 기대한다.
박민우 크라우드웍스 대표 minupark@crowdworks.kr
-
김지선 기자기사 더보기