데이터 품질관리 및 검증 분야 수행, 인공지능 데이터 생태계 및 전문인력 양성 기여

[아이티데일리] 클라우드 플랫폼 및 가상화 전문기업 나무기술이 제2차 인공지능 학습용 데이터 구축 사업에 참여한다. 나무기술(대표 정철)은 한국정보화진흥원(원장 문용식)이 진행하는 제2차 AI 학습용 데이터 구축 사업 중 ‘상황별 음성 AI 데이터’ 부문에 컨소시엄의 일원으로 참가한다.

나무기술은 수행기관인 티맥스소프트와 참여기관인 아이스크림에듀, 한국에듀테크산업협회 등과 함께 전문기관인 한국정보화진흥원과 협약을 맺고 데이터 구축 사업을 수행한다. 나무기술은 데이터 품질관리 및 검증 분야를 맡는다.

이번 구축사업은 코로나19로 촉발된 경기침체 및 일자리 충격에 대응하고 국가 차원의 인공지능 산업을 육성하고자 추경 예산을 조성해 추진하는 정부 디지털 뉴딜 공모사업이다.

▲ 제2차 인공지능 학습용 데이터 구축사업 추진 배경 및 목적

나무기술이 속한 컨소시엄에서는 한국어 강의 데이터(4000시간), 회의 음성 데이터(3000시간), 고객 응대 데이터(3000시간), 상담 음성 데이터(3000시간), 총 13,000시간의 대규모 AI 학습용 데이터를 구축함으로써, 한국인의 음성을 문자로 변환하고 문맥을 이해하는 음성 언어처리 기술 개발에 단계적으로 기여하는 사업이다.

자회사 및 투자사들을 통해 AI, 빅데이터, IoT, 스마트시티 등 4차 산업혁명 기술 및 제품을 확보한 나무기술은 인공지능 학습용 음성 데이터의 품질 관리를 수행기관 및 타 참여기관들과 함께 수행하고, 활용도가 높은 인공지능 학습용 음성 데이터 확보를 위해 내부 및 외부 검증을 맡아 진행할 계획이다.

김홍준 나무기술 상무는 “이번 사업을 통해 인공지능 학습용 음성 데이터 구축의 전 과정에서 품질 관리 요소를 파악하고, 단계별로 확보된 음성 데이터의 검증 방안을 연구하여 관계회사들과 함께 실행함으로써 디지털 뉴딜의 핵심적인 인공지능 프로젝트에서 신규 기술 인력의 채용 및 음성 인공지능 분야 인력의 전문성 향상에 기여하고자 한다”며, “AI 학습용 데이터의 품질 관리 및 검증 툴 개발의 좋은 계기를 만들겠다”고 말했다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지