[AI와 데이터 ①] 데이터 구독계약 없는 공공 AI 사업, 성능·신뢰성 ‘흔들’

데이터 업계 “금융권 본보기 삼아 제도적 기반 마련해야” 촉구

2025-07-10     박재현 기자
(사진=픽사베이)

[아이티데일리] 정부가 생성형 인공지능(AI) 분야 G3를 목표로 대규모 투자를 예고했다. 이러한 기조에 발맞춰 공공기관과 지자체에서는 생성형 AI 플랫폼 구축 사업을 추진하고, 확대 적용 가능한 분야를 모색하고 있다. 하지만 국내 데이터 업계에서는 AI 플랫폼 구축 사업에 ‘데이터 현행화’를 위한 부분이 배제됐다고 지적하고 있다. 데이터 최신화를 고려하지 않을 경우, AI 플랫폼을 구축한 초기에는 문제가 없지만 시간이 흐를수록 AI 성능과 신뢰성에 심각한 문제가 발생할 것으로 예상된다.

현재 정부나 지자체, 공공기관은 생성형 AI 플랫폼 구축사업을 추진하면서 데이터 최신화를 고려하지 않는 경향이 있다. 대부분의 공공 AI 플랫폼 사업은 솔루션 및 컨설팅에 데이터 공급이 포함되어 있다.

데이터는 AI 학습 및 구축이 일어나는 시점을 기준으로 제공된다. 만일 AI 플랫폼이 성공적으로 구축 됐다고 해도, 유지보수 사업에 AI 구축사업에 참여했던 데이터 공급사가 참여하지 못하거나 탈락할 경우 데이터 공급은 즉시 중단된다. 이 과정에서 공공기관은 데이터 최신화를 위해 외부 데이터를 연동하는 검색증강생성(RAG) 기술을 접목하고 있다.

물론 정부는 데이터 표준계약서와 활용 안내서를 배포하며 데이터 거래 및 공급 관련해 제도적 노력을 하고 있지만, 현장에서는 이것만으로는 AI를 위한 데이터 공급에 차질이 있다고 평가한다.

이에 대해 한 데이터 기업 관계자는 “정부가 제시한 표준계약서와 안내서만으로는 AI 서비스에 필요한 데이터의 ‘지속적·정기적 공급’이 보장되지 않는다. 표준계약서는 일회성 거래 또는 프로젝트 단위 공급에 초점이 맞춰져 있어, AI 모델의 최신성과 성능 유지를 위한 상시 데이터 공급 체계에는 미흡하다”고 꼬집었다.

국내 데이터 업계는 이러한 구조로는 데이터 최신화를 보장할 수 없고, 데이터를 지속적으로 공급할 수 있는 체계가 제도적으로 마련돼야 한다고 주장한다. 특히나 RAG를 활용한다면, AI 답변 최신화를 위한 꾸준한 데이터 공급이 필수적이다. 데이터 공급이 멈추면 AI는 과거의 데이터만으로 답변을 생성하기에 신뢰성에 문제가 발생하며, 종국에는 “접근이 불가하다”는 메시지를 반복적으로 내놓게 된다.

과거 빅데이터 플랫폼 구축 사업을 보면, AI 플랫폼 구축 사업을 할 때 데이터가 지속적으로 공급돼야 하는 것이 얼마나 중요한지를 알 수 있다. 한 데이터 기술기업의 대표에 따르면, 과거 추진됐던 AI를 활용하기 위한 빅데이터 플랫폼 구축 사업에서는 5년간 데이터 공급 조건이 담겨있었다. 데이터 공급 비용은 3년만 받는 조건이었다. 하지만 사업 기간 종료 후 데이터 공급이 끊기면서, 결국 사업은 성공하지 못한 채 종료됐다.

데이터 업계에서는 정부가 금융권에서 적극적으로 이뤄지고 있는 ‘데이터 구독계약’ 제도를 법제화해야 한다고 강조한다. 국내 금융권에서 적극 도입하고 있는 데이터 구독계약은 월 단위로 데이터 구독 계약을 체결해, 매달 최신 데이터를 정해진 시간에 자동으로 공급받는 계약 형태다. 사업 기간이나 유지보수 업체가 변경되더라도 데이터 최신화가 보장돼, AI 엔진의 성능을 안정적으로 유지할 수 있다. 실제로 금융 데이터 거래소 등에서는 데이터 허브, API 연동 등 다양한 구독형 데이터 상품이 활성화되고 있고, 국내 유수의 금융사에서 데이터 공급기업과 데이터 구독계약을 체결하고 있다.

금융권 외에도 세계적으로도 데이터 소유 기업과 AI 개발사 간의 데이터 공급 구독계약은 일반화되고 있다. 소셜미디어, 미디어 기업, 커뮤니티 등 다양한 데이터 소유 기업들이 AI 개발사와 데이터 공급·이용 구독계약을 체결해 AI 학습 데이터의 정기적으로 공급하고 적정 대가 지급이 이뤄지고 있다.

정부는 데이터 공급의 영속성과 지속 가능한 AI 발전을 위해서는 데이터 구독계약의 제도화와 관련 정책을 마련해야 한다. AI 플랫폼 구축 사업을 현행 그대로 유지할 경우 장기적인 관점에서 데이터 공급이 중단될 가능성이 매우 높고, AI 성능 유지가 불가능하다. 예를 들어 전국의 도로 관리를 위해 AI 플랫폼을 구축한 경우, 수시로 바뀌는 도로나 관련 시설물 데이터가 최신화되지 않을 경우, 도로 관리에 인사이트를 얻을 수 없게 된다.

국내 데이터 업계 관계자는 “AI 시대 데이터가 곧 경쟁력인 만큼, 지속적인 데이터 공급을 위한 정책적 지원과 제도화는 선결과제다. 데이터 구독계약과 같은 데이터 공급에 대한 제도적 장치가 선행되지 않으면, 정부가 바라는 AI 경쟁력 제고는 요원할 뿐이다”라고 정부의 노력을 주문했다.