데이터 모델링과 품질진단 자동화로 관리 효율성 향상

[아이티데일리] 지속되고 있는 코로나19 팬더믹 사태는 비즈니스 환경을 빠르게 변화시키고 있다. 비대면이 활성화되고 재택근무가 일상이 되면서 정보를 공유할 수 있는 클라우드의 활용은 필수적이 되었고, 공유된 정보와 온라인상에서 정보 보호를 위하여 개인정보보호를 위한 컴퓨팅도 많이 활용되고 있다.

가트너에서는 이러한 기술 트랜드의 변화를 사람 중심, 위치 독립성, 탄력적 배포등으로 표현하고 있다. 가트너에서 언급하고 있는 전략기술들을 구현하기 위한 핵심 키워드는 “데이터(DATA)”다. 언제 어디서나 구현 가능한 비즈니스를 위해 모든 기술의 기본인 데이터가 올바로 관리되고 운영되어야 명확한 비즈니스를 수행하고 결과를 도출할 수 있다.

민간기업에서는 DW/BI 및 빅데이터 환경에서 셀프 서빙(Self-Serving)이 가능한 데이터 분석과 활용에 대한 니즈가 높아지고 데이터를 자산화하기 위한 노력이 지속되면서 데이터 품질에 대래 주목하고 있다. 또한, 국내 공공기관에서는 공공데이터 개방 및 활용에 대한 정책에 따라 공공데이터를 국민이 자유롭게 이용할 수 있도록 제공하고 있다. 명확한 공공데이터의 제공은 국가 정책과 공공 서비스에 대한 신뢰성과 연계됨으로 공공데이터 품질의 중요성은 더욱 강조되고 있다.

비대면 디지털 인프라 환경 구축, 셀프 서빙 데이터 분석 및 활용에 대한 니즈, 공공 데이터 개방 및 활용 정책 활성화를 위해 데이터 관리가 중요하며 이러한 대내외적인 환경의 변화는 데이터 품질관리에 대한 중요성을 높이는 중요 요인이 되고 있다.


셀프 서빙에 대한 니즈에 따라 명확한 데이터 제공해야

특히, 공공기관의 명확한 데이터 품질관리는 체계적이고 지속적으로 수행되어야 한다. 그래야만 데이터 이용자에게 유용한 가치를 줄 수 있다. 데이터 품질관리는 데이터 문제에 대한 근본적인 원인을 찾고 해결해 나가는 활동으로 데이터 품질관리를 위한 기준을 세우고 측정하며 개선과 평가가 포함된 관리를 진행하는 것을 의미한다.

여기서 기준이란 조직, 절차, 지침과 같은 계획을 수립하고, 정성적, 정략적 진단 즉 측정을 수행하고 마지막으로 개선 및 평가를 진행하는 관리를 뜻한다.

데이터 품질관리 활동
데이터 품질관리 활동

이러한 환경에서 공공기관 정보화 담당자는 공공데이터 품질관리 수준평가에 대한 대응은 물론 지속적인 품질관리 위해 효율적인 품질관리 방안을 찾아야 한다.


공공데이터 품질관리 수준평가는?

최근 공공기관의 데이터 관리에서 화두가 되고 있는 공공데이터 품질관리 수준평가는 공공데이터 품질 수준 확보를 위하여 그 기준을 정하고 품질수준을 측정, 개선하는 활동을 지원하는 제도이다. 공공데이터는 공공기관 이용자에게 정보를 재활용할 수 있도록 제공하고, 이용자는 제공받은 정보를 비영리적, 영리적으로 이용할 수 있어야 한다. 이를 위해 공공기관은 공공데이터의 품질수준을 확보해야 하는데 이에 대한 기준을 정하고 측정, 개선하는 활동을 지원하기 위해 정부는 공공데이터 품질관리 수준평가 제도를 운영하고 있다.

공공데이터 품질관리 수준평가는 크게 3개의 영역과 9개의 지표로 구분되고 있다. 기관 품질관리, DB품질관리, 데이터 품질관리 3개의 영역에 각각의 평가지표를 정해 평가를 진행함으로써 데이터 품질 수준을 평가한다.

공공데이터 품질관리 수준평가
공공데이터 품질관리 수준평가

공공데이터 품질관리 수준평가의 본질은 지표별로 1~5등급까지 세분화되어 있어서 복잡해 보이지만 수준평가의 본질은 ‘품질관리 활동’이다. 품질관리 활동을 얼마나 체계적이고 효율적으로 진행할 수 있는가? 지속적으로 관리한가? 가 수준평가의 핵심이라고 할 수 있다.

그렇다면 공공데이터 품질관리 수준평가에는 어떻게 대응해야 할까? 공공데이터 품질관리 수준평가 가이드에 수준평가에 대한 기준과 산출물 등이 자세히 기술되어 있지만 효율적인 대응을 위해 수행절차를 정하고 작업을 그룹화해야 한다. 주요 수행 내용을 정하고 해당 프로세스와 산출물을 확인하면서 품질관리를 수행할 수 있다.

분석, 설계, 개발, 구현의 단계로 프로세스를 구분하고 업무 범위를 확정한 후, 평가까지 단계를 수행하며 주요 산출물을 확인하는 상세한 Task가 필요하다. 업무 범위를 확정하고 현황 분석을 한 후, 계획을 수립하고 개선하는 활동이 필요하다. 이처럼 공공데이터 품질관리 수준평가는 양질의 데이터 품질을 확보하기 위한 지속적인 품질 관리와 인프라가 요구된다. 이러한 복잡한 공공데이터 품질관리 수준평가에 보다 효율적인 방법으로 대응할 수 있도록 엔코아는 새로운 솔루션을 제공하고 있다.


데이터 품질진단을 하나의 패키지로 지원하는 DA#_DQ Edition
엔코아가 제안하는 디에이샵 디큐 에디션은 데이터 모델링과 품질진단을 한 번에 지원하는 솔루션으로 데이터 모델링 툴, 디에이샵(DA#)과 데이터 품질관리 솔루션 디큐샵(DQ#)의 품질진단 기능을 하나의 패키지로 구성한 제품이다. 공공기관의 공공데이터 품질관리 수준평가에 대응하는 최적의 해법으로 평가받고 있다.

간편한 데이터 품질진단과 산출물 자동 생성 지원
디에이샵 디큐 에디션은 공공데이터 품질관리 수준평가 9개의 평가지표 중, 데이터 표준관리 체계, 데이터 표준 확산, 데이터 구조 안정화, 데이터 품질진단 및 개선 관리, 오류 데이터 관리 등 5개의 평가지표를 지원하며, 간편한 데이터 품질진단과 산출물 자동 생성을 지원하고 있어 보다 편리한 공공데이터 품질관리 수준평가가 가능하다.

DA#_DQ Edition 지원 범위
DA#_DQ Edition 지원 범위

주요 데이터 표준 지원기능 제공
디에이샵디큐에디션은 데이터 표준 관리를 지원한다. 데이터 표준 관리 및 개선 활동으로 주요 데이터 표준 지원 기능을 포함하고 있다. 특히, 공공데이터 공통표준용어, 기관표준용어, DB별 표준용어의 표준과 비표준의 갭분석을 통해 DB별 구조 현행화를 지원하며, 표준 영문명 자동생성으로 편리한 데이터 표준 관리를 지원한다.

올바른 데이터 설계를 위한 데이터 구조 지원기능
디에이샵디큐에디션의 데이터 구조 지원 기능은 가장 핵심적인 기능으로 데이터 표준이 잘 지켜지고 있는지 데이터의 구조 정보를 확인할 수 있는 기능이다. 건축물의 설계도처럼 명확한 데이터를 위해서는 데이터에도 올바른 설계가 필요하다. 디에이샵디큐에디션은 이러한 데이터 설계를 위해 데이터 모델링 전 프로세스를 지원한다.

데이터 품질 지원 기능
또한 디에이샵디큐에디션은 데이터 품질 지원 기능을 지원한다. 품질진단 대상을 선정하고 오류 데이터를 측정한다. 진단대상 관리에서 조건관리, 검증 룰 관리, 코드 관리를 가능하게 하고 업무 규칙을 관리하고 진단기준 설정 및 실행을 위해 검진대상 별 진단기준을 매핑하여 진단을 실행하는 등 체계적인 품질진단 과정을 시스템에 내재화시켜 편리한 품질진단을 가능하게 한다. 또한 오류 데이터를 진단하고 진단결과를 상세히 모니터링할 수 있는 기능도 지원함으로써 진단 초기부터 결과까지 시스템내에서 관리 및 점검할 수 있다.

리포트 기능으로 가시적인 품질 진단
또한 디에이샵디큐에디션은 데이터값을 진단하고 표준과 구조진단에 대한 리포트를 자동생성한다.

디에이샵 디큐 에디션은 데이터 값, 구조, 표준 관점에서 종합적인 품질진단을 수행하고 결과에 대한 보고 및 오류 데이터 보고서 기능을 갖고 있어 데이터 표준화와 품질진단이라는 두 마리의 토끼를 다 잡을 수 있는 솔루션이다. 데이터 품질 관리 프로세스 전후에 관계없이 데이터 품질진단 상태를 점검할 수 있는 가볍지만 강력한 툴이다. 품질진단 이전에 반드시 기반이 되어야 하는 데이터 모델링을 품고 편리하고 효율적으로 품질진단을 수행할 수 있도록 지원하는 디에이샵디큐에디션은 데이터 표준화 기반의 데이터 품질 구현은 물론 지속적인 데이터 품질 관리를 가능하게 하는 솔루션이다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지