DPS TC, 올해 4월 8일 첫 회의 시작…글로벌 표준 개발 본격화 예정
[아이티데일리] 인공지능(AI) 기술이 급속도로 발전하면서 데이터의 품질과 안전성에 대한 관심이 높아졌다. 최근 데이터 출처를 명확히 하는 표준화 ‘데이터 출처 표준화’ 작업을 통해 데이터의 신뢰성을 강화하고, AI 프로그램의 안전성을 보장하려는 움직임이 나타나기 시작했다.
데이터 출처 표준화는 데이터가 생성된 곳에 대한 출처, 수집 방법, 사용 권한 등을 명확히 기록함으로써 데이터의 신뢰성을 높이기 위한 작업이다. 이는 AI 모델의 성능과 신뢰성을 좌우하는 핵심 요소로 자리 잡고 있다. 데이터 품질을 보장하고 국제 규제 준수를 지원하며 법적 리스크를 줄이는 데 기여할 수 있고, 기업 간 협업을 촉진해 효율적인 데이터 공유를 가능하게 한다는 점에서 주목받고 있는 것이다.
현재 전 세계적으로 데이터 출처 표준화에 대한 논의가 활발히 진행되고 있다. 대표적으로 데이터 & 트러스트 얼라이언스(Data & Trust Alliance)는 AI 및 데이터 응용 프로그램에서 투명성과 신뢰성을 강화하기 위해 최초의 산업 간 데이터 출처 표준을 발표했다. 이 표준은 데이터를 생성한 시점, 방법, 사용 목적 및 제한 사항을 포함한 메타데이터를 포함·제공한다. 기업들이 데이터를 구매하거나 사용할 때 정해진 표준을 따름으로써 규제를 준수하고 운영 효율성을 높이는 데 기여할 수 있다. 이는 곧 AI 기반 의사결정 시스템에서 신뢰성을 확보하는 데 중요한 역할을 하기도 한다.
우리 정부 역시 데이터 출처 표준화를 강화하기 위해 개인정보보호법을 다듬었다. 정부는 법을 정비함으로써 데이터 주체의 권리를 명확히 하고, 데이터 처리 과정에서 출처를 기록하도록 만들어 데이터 안전성을 높일 수 있다는 계산을 한 것이다. 또한 마이데이터 서비스를 확대해 개인이 자신의 데이터를 선택적으로 활용할 수 있는 환경을 조성하고 있으며, 이를 지원하기 위한 데이터 포맷과 전송 규격 표준화도 추진하고 있다. 개인 데이터를 활용할 때 출처와 사용 목적을 명확히 하도록 요구할 경우 데이터 신뢰성을 강화하는 데 도움을 준다.
아울러 국제적 기준도 적극 도입하고 있다. 한국은 AI 개발에서 데이터 품질 평가를 위한 국제 표준(ISO/IEC 5259-1:2024)을 채택해 글로벌 수준의 데이터 품질 관리 체계를 구축했다. 이 표준은 AI 모델 훈련 및 평가 과정에서 데이터 출처를 명확히 기록하도록 요구하며, 데이터 신뢰성과 투명성을 확보하는 데 중요한 역할을 한다.
그러나 표준화 작업에는 해결해야 할 과제도 산적한 상황이다. 산업 간 복잡한 구조로 인해 통일된 데이터 출처 표준에 대한 기준을 마련하는 데 어려움이 따르며, 대규모 데이터를 효율적으로 관리하기 위한 클라우드 기반 메타데이터 관리 시스템 도입도 필요한 상황이다. 개인정보보호 중요한 과제로, 출처 정보에 포함된 개인정보를 익명화하거나 암호화하는 기술적 조치가 요구되는 상황이다.
그럼에도 향후 데이터 출처 표준화의 전망은 장밋빛이다. AI와 디지털 서비스의 신뢰성 확보를 위한 핵심 요소로 자리 잡을 것으로 전망된다. 비영리 표준 기구인 OASIS 오픈과 데이터 & 트러스트 얼라이언스가 주도하는 ‘데이터 출처 표준화 기술위원회(DPS TC)’는 2025년 4월 첫 회의를 시작으로 글로벌 표준 개발을 본격화할 예정이며, 기업들이 데이터를 보다 투명하게 관리하고 활용할 수 있도록 지원할 예정이다.
SW 기업관계자에 따르면 “DPS TC에서는 데이터의 기원과 사용 이력을 추적할 수 있는 메타데이터 프레임워크를 개발하고 있으며, 자동화 도구를 활용한 메타데이터 생성 및 검증을 통해 표준을 구현하고 확장성을 제공할 예정인 것으로 알려졌다. 이 표준은 데이터베이스, 테이블, 칼럼 수준은 물론 그래프 데이터베이스와 NoSQL 데이터베이스, API를 통한 데이터 교환에도 적용 가능한 것으로 알고 있다. AI 응용 프로그램의 확산으로 인해 데이터 출처에 대한 명확성이 더욱 중요해지고 있다. 데이터를 구매하거나 사용할 때 그 기원과 권리, 제한 사항을 명확히 파악해야 하며, 이를 통해 데이터 준비와 정제에 소요되는 비용을 절감하고 효율성을 높일 수 있다”고 첨언했다.


