‘태스크 설계 고려사항’, ‘결과 데이터 명세 지침’ 등 2건 채택
데이터 라벨링 생태계의 원활한 의사소통과 호환성 확보 기대

[아이티데일리] 크라우드웍스(대표 박민우)는 자사의 데이터 라벨링 기술이 국내 정보통신기술(ICT) 분야 표준으로 채택됐다고 11일 밝혔다.

한국정보통신기술협회(TTA)는 지난 8일 제100차 정보통신표준총회에서 크라우드웍스의 데이터 라벨링 표준 ‘태스크 설계 고려사항’과 ‘결과 데이터 명세 지침’ 등 두 건(TTAK.KO-10.1336-Part1, 2)을 각각 정보통신단체표준으로 채택했다. 표준검토위원회에는 한국지능정보사회진흥원(NIA), 한국전자통신연구원(ETRI) 등 다수의 기관과 기업으로 이루어진 빅데이터 프로젝트그룹(PG1004)이 참여했다.

‘태스크 설계 고려사항’과 ‘결과 데이터 명세 지침’은 ▲데이터 라벨링과 태스크의 개요 ▲대표적인 데이터 라벨링 유형 ▲데이터 라벨링 태스크 설계 절차 및 고려사항 ▲결과 데이터 개요 ▲라벨 추출 절차의 필요성 ▲표준화된 데이터 라벨링 결과와 데이터 명세 도입 등의 필요성 등에 대해서 기술한 것이다.

크라우드웍스 측은 그동안 표준이 없어 데이터 라벨링 태스크 설계에 어려움을 겪었던 기업들이 이번 정보통신단체표준을 통해 원활한 의사소통과 서비스 제공자 간의 호환성 확보 등이 가능해졌다고 설명했다. 또한 결과 데이터 명세 지침을 활용해 데이터 댐 사업으로 만들어질 공공 데이터들의 재사용이 가능해지며 데이터 활성화의 기반이 만들어질 것으로 전망했다.

크라우드웍스 박민우 대표는 “인공지능(AI) 기술 고도화와 데이터에 대한 중요성이 어느 때보다 높아지며, 데이터를 수집하고 가공하는 데이터 라벨링에 대한 단체표준은 국내뿐만 아니라 전 세계에서 필요로 했던 표준”이라며, “하나의 기준으로 자리잡은 이번 표준이 그동안 표준 부재로 인해 발생한 데이터 라벨링 생태계 구성원들의 어려움을 해소할 수 있기를 바란다”고 말했다.

한편 크라우드웍스는 자사의 데이터 라벨링 제정 표준에 따라 절차와 시스템을 구현하며 국내외 330곳 이상의 고객사에게 8,800만 개가 넘는 데이터를 제공해왔다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지