산업 고도화로 전문성 요구…단순 반복 작업 인식 적절치 않아
[아이티데일리] 최근 다시금 데이터라벨링이 조명받고 있다. 데이터라벨링은 단순 반복 작업의 특성이 있어 소위 ‘인형 눈 붙이기’라는 표현으로 불리기도 한다. 하지만 일각에서는 ‘인형 눈 붙이기’라는 표현이 데이터라벨링을 설명하기에 적절치 않다는 주장이 제기된다. 점차 데이터 산업이 고도화되면서 전문성이 요구되고 있으며 이를 반영하지 못한 표현이라는 지적이다.
지난 10일(현지 시각) 페이스북 모회사 메타 플랫폼스(이하 메타)가 AI 데이터 전문기업 스케일 AI(Scale AI)의 지분 49%를 약 20조 원에 인수한다고 발표했다. 이번 인수는 메타의 장기 목표인 범용 인공지능(AGI) 개발 여정의 일환으로, AI 개발 과정에서 데이터라벨링의 중요성을 보여줬다.
데이터라벨링은 초기에 수많은 이미지나 텍스트에 특정 정보를 표시하거나 분류하는 작업을 끊임없이 반복하는 것이 중심이었다. 복잡한 판단이나 고도의 기술이 필요하기보다는 정해진 위치에 동일한 작업을 반복하는 ‘인형 눈 붙이기’와 비슷했으며 이 때문에 ‘IT 업계의 인형 눈 붙이기’와 같은 별명이 붙기도 했다.
하지만 데이터라벨링 산업이 점차 고도화되면서 라벨링 작업에서 전문성이 요구되기 시작했다. 의료, 법률 등 전문 지식에 대한 데이터를 처리할 경우 전문가의 도움이 필요했고 AI 모델 학습에 최적화된 데이터를 선별, 정제, 관리, 품질 검증하는 ‘데이터 큐레이션’이 중요해졌다. 업계 관계자들은 이러한 상황을 반영하지 못하고 아직도 ‘인형 눈 붙이기’라는 표현으로 데이터라벨링 산업을 지칭하는 것은 적절치 않다고 지적했다.
국내에서 데이터라벨링 사업을 하고 있는 한 기업의 관계자는 “최근 메타가 스케일 AI를 인수한 것에서 짐작할 수 있듯이 데이터라벨링은 AI 구축에 매우 중요한 요소다. 그럼에도 최근에도 ‘인형 눈 붙이기’ 표현이 사용되고 있다”며 “그런 표현이 그만 사용됐으면 한다. 이제는 데이터라벨링 작업이 일정 부분 자동화로 진행되기 시작해 처리된 데이터를 검수하는 작업이 중요해졌으며 이에 전문가들의 도움이 필수적이다”라고 말했다.
이어 “특히 의료 분야의 데이터를 처리하기 위해서는 전문성이 필수적이라 경력 단절 여성과 같은 분들의 도움을 받아 작업을 진행 중이다. 다양한 분야의 전문가들이 도움을 주고 있으며 자신이 종사하는 업계를 위한 전문성 있는 데이터를 구축하겠다는 열망으로 도움을 주고 있다”며 “물론 단순 반복 작업이 필요한 부분이 아직 필요하고 중요한 것은 맞으나, 업계 전체가 ‘인형 눈 붙이기’로 지칭되는 현상이 없었으면 한다”고 덧붙였다.
실제로 최근 합성 데이터의 등장으로 데이터라벨링이 더욱 변화하고 있다. 실제 데이터의 양적, 질적 한계를 극복하기 위해 인공적으로 생성된 데이터로, 실제 데이터와 적절히 조합해 AI 학습에 사용된다. 앞으로 데이터라벨링 산업이 어떻게 진화할지 주목되는 상황이다.


