학습용 데이터, 고성능 컴퓨팅 자원 등 ‘AI 혁신’ 위한 양질의 개발환경 제공

[아이티데일리] 과학기술정보통신부(장관 최기영, 이하 과기정통부)는 인공지능(AI) 강국으로의 도약을 위해 누구나 손쉽게 활용할 수 있는 개발환경을 제공한다고 29일 밝혔다.

AI 개발을 위해서는 양질의 학습용 데이터와 고성능 컴퓨팅 파워가 필수적이지만, 이를 마련하기 위해 많은 예산과 시간이 소요돼 중소·벤처기업 등이 자체 구축하기에는 어려움이 있는 상황이다.

이에 과기정통부는 지난 2018년부터 학습용 데이터와 고성능 컴퓨팅, 알고리즘 등을 원스톱으로 지원하는 ‘AI 허브(www.AIHub.or.kr)’를 운영하고 있다. 특히 ‘AI 허브’에 대한 투자 금액을 매년 확대해(2018년 92.56억 원, 2019년 310억 원, 2020년 761억 원) 민간의 혁신을 적극적으로 지원하고 다양한 AI 제품·서비스의 개발을 촉진시키고 있다.

▲ AI 개발환경 및 자원을 원스톱 지원하는 ‘AI 허브’

AI 학습용 데이터 측면에서는 그동안 제공한 11종/1,850만 건에 이어 올 연말 10종/2,500만 건을 추가로 개방했다. 일방적인 데이터 개방을 넘어 민간이 자발적으로 데이터를 확장시키는 생태계를 구축할 수 있도록 ▲라벨링 할 수 있는 데이터 저작도구 ▲데이터 구축 및 품질 검증 방법 등을 제시한 AI 데이터 셋 표준 가이드북 등을 함께 공개했다.

고성능 컴퓨팅 지원 측면에서는 상대적으로 열악한 컴퓨팅 환경을 보유하고 있는 200개의 중소·벤처기업 등에게 20TFlops 수준의 연산이 가능한 GPU 컴퓨팅 자원을 제공했다. 이를 통해 의료, 복지, 교육 등의 분야에서 AI 서비스 개발 시간을 크게 단축시켰다.

마지막으로 알고리즘 측면에서는 미국 연방 정부의 챌린지(Challege.gov) R&D 방식을 벤치마킹한 AI 온라인 경진대회를 개최했다. 영상·수치·언어처리 분야의 20개 문제에 206개 팀(474명)이 참여했으며, 이 중 20개 우수기업을 선정하고 총 32억 원의 사업화 보조금을 지원했다.

▲ AI 학습용 데이터 셋 구축·개방 현황

한편 과기정통부는 내년에도 민간 수요를 반영한 AI 학습용 데이터와 고성능 컴퓨팅 자원을 확충하는 등 AI 강국으로 도약하기 위한 혁신 생태계 조성에 더욱 박차를 가할 계획이다.

먼저 국내 AI 산업의 실질적인 도움이 되는 데이터를 구축하기 위해 다양한 기업의 시장 수요 및 기술 트렌드를 반영해 올해의 2배 규모인 20종/6천만 건 이상의 AI 학습용 데이터를 구축·개방할 예정이다. 특히 ‘유튜브’ 등에서 동영상 데이터 사용이 기하급수적으로 증가함에 따라 정지영상의 이미지보다 대용량 동영상 데이터의 비중을 높일 계획이다.

고성능 컴퓨팅 자원은 올해보다 4배 이상 확보해 기존 중소·벤처기업 중심에서 대학, 연구기관까지 지원 대상을 확대한다. 컴퓨팅 자원이 필요한 개발자들을 상시 지원하기 위해 연중 수시로 신청을 받고, 수요자의 데이터 처리 수준 및 역량에 따라 연산용량을 10~40TFlops 범위 내에서 차등 지원한다.

AI 온라인 경진대회 규모도 확대한다. 공공 및 기업에서 직면한 40개의 도전적인 문제를 제시하고 국내·외 기업 및 대학 등의 개발자들이 자유로운 교류와 경쟁을 이어갈 수 있는 현장을 마련한다. 또한 우수기업에게는 사업화 보조금 역시 지속적으로 지원한다.

아울러 AI 수요기업이 자사 제품에 활용 가능한 최적의 AI 솔루션을 도입할 수 있도록 ‘AI 바우처 사업’도 신규 추진한다. 내년에는 14개 기업을 대상으로 시범 운영하고, 수요를 고려해 지속적으로 확대해 나갈 예정이다.

과기정통부 관계자는 “혁신의 주체인 개발자들이 마음껏 상상하고 함께하고 도전할 수 있도록 AI 개발의 핵심 인프라를 만드는 것이 중요하다”며, “‘AI 허브’의 인프라를 이용해 우리나라 기업, 대학, 연구소의 창의적인 아이디어가 경쟁력 있는 서비스로 발전할 수 있기를 기대한다”고 말했다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지