크라우드 소싱 방식으로 ‘랜드마크 이미지 데이터’ 및 ‘딥페이크 변조 영상 탐지 데이터’ 구축

[아이티데일리] 크라우드웍스(대표 박민우)는 과학기술정보통신부가 추진하는 ‘딥페이크 방지영상’과 ‘랜드마크 이미지’의 AI 학습용 데이터 구축 사업을 진행한다고 30일 밝혔다.

과기정통부의 AI 학습용 데이터 구축 사업은 AI 통합지원 플랫폼 ‘AI허브’를 통해 AI 개발에 필요한 데이터를 구축·개방하는 것을 목표로 한다. 크라우드웍스는 10개 지정공모 사업 중 2개를 수주했다.

‘랜드마크 이미지’ 과제는 국내 특성(지리 공간적, 기능적)이 반영된 국내 도심 민간건물, 공공기관, 관광명소, 편의시설 등 주요 랜드마크 이미지 데이터를 구축하는 것이다. 전국 주요 50개 도시의 랜드마크 이미지 500만 장 이상을 AI 학습용 데이터로 구축하게 된다.

크라우드웍스는 자사가 운영하는 플랫폼에 등록된 15만 명 이상의 작업자를 활용해 해당 과제를 진행한다. 수집하고자 하는 랜드마크는 버스정류장 또는 지하철 역사 이름에 사용되는 랜드마크, 초·중·고 교과서를 바탕으로 건물·지형·유적/유물에 해당되는 랜드마크로 선정하며, 랜드마크 성격은 ▲지역별 공공기관 ▲주요 건물 ▲관광명소 ▲편의시설 ▲유적/유물 등으로 구분하게 된다.

‘딥페이크 방지영상 AI 데이터’는 한국인 특성을 반영하는 얼굴 합성과 탐지용 합성 데이터의 생성을 주요 사업 내용으로 한다. 이 사업은 GAN(Generative Adversarial Networks) 기반의 변형 알고리즘을 통해 생성된 변조 영상(딥페이크)을 탐지·검출하는 AI 기술 개발을 위해 활용될 것으로 기대된다.

이를 위해 크라우드웍스는 자사의 크라우드소싱 플랫폼을 통해 성별, 연령, 키, 몸무게가 다양한 참여자를 모집하고, 동시에 많은 사람이 셀프 동영상을 쉽게 업로드할 수 있도록 모바일 기반의 크라우드소싱 플랫폼도 사용한다. 참여자들이 크라우드웍스 모바일 앱을 사용해 제시된 시나리오에 따라 쉽고 빠르게 동영상을 셀프 촬영해 업로드할 수 있도록 지원할 계획이다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지