“데이터 유통 활성화에 IT산업 미래 10년이 달렸다”
[아이티데일리] 전 세계적인 코로나19 팬데믹으로 사회·경제·문화 전 영역에서 혼란을 겪은 2020년은 일부에게는 기회가 된 한해이기도 하다. IT업계는 많은 사업들이 연기 혹은 취소돼 타격을 입었고 영업과 마케팅 측면에서 다소 어려움을 겪기도 했지만, 전통적인 대면 기반의 산업군보다는 위기에 잘 대처하고 있는 것으로 평가된다.
위기의 2020년을 지나고 있음에도, 국내 IT업계는 올해를 데이터 경제 활성화의 첫 발을 뗀 한 해로 기억할 것이라는 점에서 의미가 있다. 바로 데이터 3법 개정안이 통과되고, 정부의 초대형 경기부양 정책인 ‘디지털 뉴딜’이 본격적으로 시작됐기 때문이다.
그동안 많은 전문가들이 미래의 새로운 성장 동력으로 ‘데이터(Data)’의 중요성이 높아질 것이라는 전망을 내놨고, 이에 국내에서도 데이터 기반의 비즈니스를 추진하고자 많은 기업들이 도전에 나섰다. 하지만 실제 기업들은 사업에 필요한 데이터를 얻지 못해 많은 어려움을 겪었고, 정부와 관련 기관에 성토가 이어졌다.
그러던 중 지난해 한국데이터거래소(KDX)가 개소되고, 마침내 올해 업계의 숙원이었던 데이터 3법 개정안이 시행되는 등 각종 여건이 마련되며 데이터 경제의 활성화가 눈앞에 보이고 있다. 이에 본지(컴퓨터월드/IT DAILY)에서는 데이터 경제의 핵심이 되는 ‘데이터 유통’을 주제로 공동기획기사를 준비했다. 정부와 업계가 손잡고 본격적인 밑그림을 그려나가고 있는 ‘데이터 생태계’가 어떻게 꿈틀거리며 성장하고 있는지 알아본다. <편집자>
1부 - ‘디지털 뉴딜’로 데이터 유통 활성화 기반 마련
2부 - ‘10대 빅데이터 플랫폼’으로 데이터 유통 생태계 다진다
3부 - 안전한 데이터 유통 환경, 데이터거래소가 책임진다
새로운 산업 발전의 핵심 동력 ‘데이터’
인공지능(AI), 사물인터넷(IoT), 클라우드 등 차세대 기술에 기반한 4차 산업혁명이 화두가 되면서, 각종 산업계가 한 단계 새로운 발전을 꾀할 수 있는 핵심 동력으로써 ‘데이터’의 중요성이 강조되고 있다. 올해는 특히 1월 국회에서 데이터 3법 개정안(개인정보보호법, 정보통신망법, 신용정보법)이 통과되면서, 본격적인 데이터 경제 활성화의 기반이 마련돼 업계의 기대가 큰 한해였다.
이 같은 흐름 속에서 올해 정부는 데이터 기반의 혁신이 가속화될 수 있도록 각종 제도를 개선하고, 관련 기업들에 대한 지원방안을 마련하는 데 힘을 쏟았다. 데이터의 중요성은 문재인 정부가 코로나19로 인한 경기침체를 극복하고 미래 성장 동력을 마련하기 위해 추진하고 있는 ‘한국형 디지털 뉴딜’ 사업에서도 특히 강조됐다. 데이터(Data)·네트워크(Network)·인공지능(AI), 즉 ‘D.N.A’와 관련한 생태계를 강화하는 것이 ‘디지털 뉴딜’의 핵심 사업 중 하나로 꼽히면서 데이터의 축적과 가공, 즉 ‘데이터 유통’에 관한 정책과 사업들이 빠르게 진행되고 있는 것이다.
특히, 데이터 유통의 기반을 다져 생태계를 조성한다는 측면에서 수많은 데이터를 댐과 같은 곳에 모은다는 ‘데이터 댐’ 구축의 중요성이 강조되고 있다. ‘데이터 댐’ 구축을 위한 7대 핵심 사업은 미국 대공황 시기의 ‘후버댐’ 건설과 같은 일자리와 경기 부양 효과에 더해 우리 미래를 위한 투자와 각 분야의 혁신을 동시에 추진하기 위해 기획됐다. 사업은 ▲인공지능 학습용 데이터 구축 ▲인공지능 바우처와 ▲인공지능 데이터 가공바우처 사업 ▲인공지능 융합 프로젝트(AI+X) ▲클라우드 플래그십 프로젝트 ▲클라우드 이용바우처 사업 ▲빅데이터 플랫폼 및 센터 구축 등 크게 7개 영역으로 나뉘어 추진된다.
‘데이터 댐’ 구축 위한 투자 확대
‘데이터 댐’ 구축을 위한 7대 핵심 사업 가운데 ‘데이터 유통’을 중심으로 특히 자세히 살펴볼 부분은 인공지능(AI) 개발을 위한 대규모 데이터 구축사업으로, 이는 일명 ‘데이터 댐’을 만든다는 정부 구상의 핵심과제라 할 수 있다. 정부는 이미 2017년부터 AI 학습용 데이터 구축사업을 진행해 ▲한-영 번역 말뭉치 ▲한국어 음성 ▲이상 행동 영상 등 텍스트, 이미지, 영상 분야의 인공지능 서비스 개발을 위한 기계학습용 데이터 21종, 4,650만 건을 구축하고 AI 통합지원 플랫폼인 ‘AI 허브(AI hub)’를 통해 공개하고 있다.
여기에 추가로 올해 내 추경 포함 총 2,925억 원이 투입되는 ‘AI 학습용 데이터 구축’ 사업이 ‘디지털 뉴딜’의 일환으로 확대 진행되고 있다. 이 사업은 AI가 읽을 수 있는 데이터 플랫폼을 구축해 사회 전반에서 AI가 효율적으로 활용될 수 있도록 하는 것이 목적으로, 한국정보화진흥원(NIA)이 수행한다.
당초에는 작년보다 예산 및 과제가 2배 늘어난 390억 원 규모의 20개 과제가 추진됐었으나, 추경을 통해 올해까지 2,925억 원이 투입된다. 10대 분야 150종의 데이터를 선정해 72개의 그룹 과제가 최종 도출됐으며, 총 584개 기업·기관들이 사업을 수행한다. 주요 인공지능 개발 전문기업, 크라우드소싱 기업 등은 물론이고 서울대학교, 한국과학기술연구원(KAIST) 등 37개 대학산학협력단과 서울대병원, 국립암센터 등 21개 주요병원 등 분야별 전문기업·기관이 대거 사업에 참여했다.
이들은 한국어 말뭉치, 농작물 병해충 이미지, 암 질환 영상 등 텍스트 7억 건, 음성 6만 시간, 이미지 6천만 건, 영상 1만 5천 시간 등 대규모 데이터를 구축하고 있으며 이를 통해 국내 AI 산업의 획기적인 도약의 계기를 마련할 것으로 기대된다. 구축된 데이터는 국내 벤처기업과 스타트업, 중소기업들이 AI 학습용 데이터와 알고리즘, 고성능 컴퓨팅 자원을 쉽게 활용할 수 있는 ‘AI 허브(AI Hub)’ 플랫폼을 통해 공개된다.
빅데이터 플랫폼 및 센터도 지속 확충
데이터의 유통을 위한 ‘빅데이터 플랫폼 및 네트워크 구축’ 사업도 D.N.A 생태계 강화를 위한 또 다른 핵심 사업으로 꼽힌다. ‘빅데이터 플랫폼 및 네트워크 구축’ 사업은 코로나 19 확산에 따른 경기 둔화를 극복하고 새로운 성장 동력을 마련하기 위한 것으로, 핵심 자원인 데이터를 생산·구축하고 유통·거래하는 기반을 조성하기 위해 추진된다.
올해는 총 405억 원이 투입돼 5개 빅데이터 플랫폼과 50개의 센터를 추가 구축한다. 올해 5개 플랫폼이 신규 구축되면 금융, 환경, 문화, 교통, 헬스케어, 유통, 통신, 중소기업, 지역경제, 산림 등 지난해 마련한 10개 부문의 빅데이터 센터와 연계해 양질의 데이터가 데이터 댐에 지속적으로 공급될 것으로 기대된다.
이 사업은 빅데이터 플랫폼을 구축해 데이터의 수집과 유통 및 활용 기반을 마련하고, 분야별 데이터 표준화를 추진하는 것이 핵심으로, ‘통합 데이터 지도(www.bigdata-map.kr)’와 연계해 국민들이 유용한 데이터를 쉽게 검색·활용할 수 있도록 정보를 제공할 계획이다. 뿐만아니라 과기정통부는 분야별 플랫폼 10개소와 이와 연계된 기관별 센터 100개소를 구축하는 데 3년간 총 1,516억 원을 투입할 계획이며, 올해는 10개 플랫폼에 24억 원씩 총 240억 원, 100개 센터에 4억 원씩 총 400억 원 등 총 640억 원 규모로 사업을 추진하고 있다.
AI 데이터 가공 바우처 지원사업으로 생태계 활성화
중소기업과 스타트업 등이 보유한 데이터를 AI 학습용 데이터로 전환시켜 혁신적인 AI 서비스를 개발할 수 있도록 지원하는 489억 원 규모의 ‘AI 데이터 가공 바우처 지원사업’도 확대 추진됐다. 지난해 471개 기업이 신청했던 이 사업은 올해 2,076개(본사업 924개+추경 1,152개) 기업으로 신청 수가 늘었다. 이는 다양한 산업 분야에서 AI 개발 수요가 확대되고, 데이터 경제 역시 빠르게 확산하는 모습을 보여줬다는 점에서 고무적이라는 평가다.
과기정통부에 따르면 1,152개 과제 중에서 최종적으로는 620개가 지원 적격 수요기업으로 선정됐다. 특히 이들 중 예비창업자와 1인 창조기업, 소상공인의 비중이 늘어나 데이터 활용이 소규모 사업체로까지 확산되고, 데이터 기반의 창업이 활성화되고 있는 것으로 평가된다.
이외에 총 560억 원 규모의 ‘인공지능 바우처’ 지원 사업도 진행된다. 사업을 통해 다양한 분야의 중소·벤처기업들이 자사 제품이나 서비스에 인공지능을 도입해 생산성을 높이고 기업 경쟁력까지 높일 수 있을 것으로 기대된다. 475개 과제에 733개 기업이 지원했으며, 반도체 개발부터 창업, 치매예측, 투자분석, 수어번역, 법률, 대기오염 측정 등 17개 분야에서 최종 209개 수요기업이 혜택을 받게 됐다.
이밖에 282억 원 규모의 AI 융합 프로젝트와 클라우드 플래그십 프로젝트(250억 원), 클라우드 이용 바우처 사업(80억 원) 등도 ‘데이터 댐’ 구축을 위해 진행되고 있다.
과학기술정보통신부 측은 “중소기업과 스타트업 등은 비용 부담과 인력 부족 때문에 필요한 AI4 학습용 데이터를 직접 구축하는 데 어려움이 많아 양질의 데이터 확보에 대한 수요가 크다. 시장에서 필요한 양질의 AI 학습용 데이터를 많이 확보하는 것이 단기간에 우리나라 AI 경쟁력을 끌어 올릴 수 있는 해결책이 될 수 있다”고 강조하면서, “AI 학습용 데이터 구축을 대규모로 확대 구축해 데이터 댐에 모으고, 다양한 AI 기술 연구와 상용화 서비스 개발에 활용할 수 있도록 지원하겠다. 이를 통해, 양질의 일자리 창출과 경제성장의 새로운 원동력을 확보할 수 있을 것으로 기대한다”고 밝혔다.


