크라우드웍스, ‘독자 AI 파운데이션 모델’ 공동 데이터 공급기관 참여
선정된 5개 팀이 활용할 공동 데이터 공급…직접 구축, 자체 검수 통해 신뢰도 향상
2025-08-05 권영석 기자
[아이티데일리] 크라우드웍스는 과학기술정보통신부(이하 과기부)가 추진하는 ‘독자 AI 파운데이션 모델’ 사업에 선정된 5개 개발팀이 활용할 공동 데이터 공급기업으로 참여한다고 5일 밝혔다.
크라우드웍스는 이번에 선정된 5개 개발팀의 AI 개발에 활용될 품질과 신뢰성을 확보한 고품질 데이터를 지원할 예정이다. 특히 저작권 문제를 합법적으로 해결한 ‘STEM 데이터셋’과 국내 최다 규모의 도서 데이터셋, 국내외 뉴스 데이터, 국어학 데이터 등 국내에서 구하기 힘든 데이터셋들을 공급한다.
STEM 데이터셋은 과학(Science), 기술(Technology), 공학(Engineering), 수학(Mathematics) 등 고차원적 전문 지식이 담긴 데이터셋으로, 이는 AI의 추론·분석·문해 역량 향상에 기여할 수 있다.
크라우드웍스 측은 이번 사업에 공급하는 모든 데이터를 직접 구축하거나 자체 검수 시스템을 통해 전문성과 품질을 검증해 데이터 정확도와 신뢰도를 높였다고 강조했다. 이를 바탕으로 개발팀의 개발 방향에 따라 맞춤형 데이터셋 공급이 가능하다는 설명이다.
크라우드웍스 김우승 대표는 “AI 모델의 성능은 결국 데이터를 기반으로 결정된다”며 “국내외에서 인정받은 데이터 품질과 전문성을 바탕으로, 개발팀의 성공적인 AI 모델 개발에 기여할 수 있기를 기대한다”고 말했다.