10.23
뉴스홈 > 칼럼
데이터 관리 이슈 – DQ와 Meta를 중심으로현업의 데이터 활용이 품질에 가장 큰 영향 미쳐
정보화의 발전으로 많은 업무가 IT로 처리되면서, IT 시스템의 효용이 업무 자동화나 효율화를 넘어서서, 보유 데이터의 전략적 활용 차원으로 확산되고 있다. 특히, 경쟁이 심화되면서, 보유 데이터의 분석을 통한 전략적 방향 수립이 점점 중요한 경쟁 수단을 대두되고 있다.

소비자보호원에 접수되는 네비게이션 제품 관련 불만이 과거에는 기계 작동이나 기능 등 기술적인 부분이었지만, 최근에는 지도의 부정확성 등 네비게이션 데이터의 품질 문제로 옮겨가고 있다. 이는 원하는 기능이 자동화된 이후에는 시간이 지날수록 데이터의 품질이 중요한 이슈로 떠오른다는 것을 보여주는 사례라고 할 수 있다.

세밀하고 다각적인 데이터 관리 활동 수행해야 = 경쟁이 심화되면서 현황 파악이나 미래 전망을 위해 정확한 데이터를 요구하는 경우가 많아지고, 데이터를 다각적으로 분석하여 마케팅이나 신제품 개발 등에 전략적으로 활용하는 단계를 넘어 실시간으로 발생하는 데이터를 분석하여 바로 업무 처리와 연결할 수 있는 RTE(Real Time Enterprise)로의 전환을 서두르는 기업도 많이 있다.

하지만 이러한 업무를 적절히 지원할 수 있는 데이터 품질을 확보하는 것은 손쉬운 일이 아니다. 데이터 품질을 저해하는 여러 가지 요인들이 산재해 있기 때문에, 세밀하고 다각적인 데이터 관리 활동을 수행해야 가능하다.

데이터 품질에 가장 많은 영향을 미치는 것은 현업의 데이터 활용과 관련한 측면이다. 우선 초기 데이터 확보 과정에서 정확한 데이터를 입력하기 위하여 정형화되고 표준화된 기준이 존재해야 하며, 입력된 데이터를 사후에 점검해보는 역할이 필요하다. 그리고 잘못된 데이터를 책임지고 수정하고, 고의나 실수로 인한 데이터 변형이 최소화될 수 있도록 데이터 권한에 대한 관리가 이루어져야 한다.

분산된 데이터의 중복으로 인하여 데이터 불일치가 발생하고, 데이터의 통합에도 어려움을 겪는 것은 거의 대부분의 기업에서 경험하는 일이다. 물론 데이터 분산을 배제하고 통합된 하나의 DB로 데이터를 관리하는 것은 적절하지 못하다. 방대한 데이터를 한 개의 DB로 관리하는 것도 문제이지만, 변화가 많은 업무를 지원하기 위해서는 분산된 환경이 훨씬 많은 유연성을 확보할 수 있기 때문이다.

그렇지만, 분산된 속에서도 전사 표준을 준수하고 전사의 분류 체계를 공유하면서 상호 운용성을 높일 수 있는 방향으로의 데이터 구조 관리가 필요하다. 전사 차원의 통합적인 데이터 구조 관리를 위해서는 각 시스템의 데이터 구조를 정확하게 파악하는 것이 우선되어야 하며, 데이터의 변경이 발생할 경우 이를 모두가 공유할 수 있는 환경이 필요하다.

메타데이터시스템은 전사 차원에서 데이터 구조를 관리할 수 있는 기반을 제공해주고 있다. 하지만 단지 기존 시스템의 데이터 구조를 모아 놓기만 한다면, 메타데이터의 효용이 그리 높지 않다.

각 시스템의 데이터 구조는 각자의 입장에서 정리되어 있어, 모든 사람이 쉽게 이해하고 활용하기는 어렵다. 또한 전체적으로 보면 시스템 구조 간의 불일치나 불합리성도 발견할 수 있다.

"데이터 품질이 기업의 사업 전략 좌우" = 그러므로 전사의 데이터 표준(용어, 코드, 형태)을 준수한 상태로의 통합적 관점에서의 데이터 관리가 필요하다. 이미 구현된 시스템의 경우에는 표준화된 통합 구조와의 매핑을 통하여 단계적으로 관리 범위에 포함시켜야 한다.

최근에는 데이터의 유출 등을 통하여 사회적인 물의를 빚는 경우가 종종 발생한다. 그러므로 데이터의 보안이나 성능 등과 같은 물리적인 특성들도 데이터 품질의 범주에 속한다고 할 수 있다. 데이터의 체계적인 관리를 위해서는 데이터의 직접적인 사용자인 현업, 데이터 구조를 설계하는 IT 개발자, DB운영에 책임이 있는 DBA 등 많은 사람이 관여하게 되므로 이들 간의 정확한 책임과 역할이 정의되고 성실한 수행이 전제되어야 한다.

데이터 품질은 데이터 값 자체의 품질 뿐 아니라 사용의 편리성이나 유용성과 같은 활용적 측면의 품질, 보안이나 성능과 같은 물리적인 품질 등이 있으며 이러한 품질 기준에 대하여 전사적인 공감대가 형성되어야만 체계적인 관리를 수행할 수 있다.

데이터 품질 기준도 다양하지만, 품질을 확보해야 하는 대상 데이터도 방대하므로, 이를 한꺼번에 해결하려고 할 것이 아니고, 중요 데이터를 중심으로 가장 시급한 품질 기준을 설정하여 단계적으로 품질 확보 작업을 수행하는 것이 바람직하다.

특히 여러 데이터 관리 활동 등이 체계화되어야 해결될 수 있는 문제들도 많이 존재하므로 현실적인 입장에서 품질 개선 목표를 설정하고 지속적인 품질 향상 활동을 수행하는 것이 중요하다. 그리고 책임 있는 데이터 품질 관리 활동을 위해서는 현업이 주축이 되는 데이터 오너를 통하여 지속적이고 세밀한 관리가 이루어져야 한다.

데이터의 중요성은 향후 점점 높아질 것이지만, 데이터의 품질을 확보하는 것은 많은 시간과 노력이 소요되는 작업이다. 지금부터 데이터 품질에 관심을 같고 체계적으로 접근하는 기업은 향후 적극적인 데이터 활용을 통하여 시장 환경에 적절히 대응할 수 있겠지만, 준비가 늦은 기업은 데이터의 품질 문제로 인하여 전략적인 방향 수립에 어려움을 겪게 될 것이다. 그러므로 데이터 품질 확보 활동에 보다 많은 관심이 필요한 시점이다.

인기기사 순위
(우)08503 서울특별시 금천구 가산디지털1로 181 (가산 W CENTER) 1713~1715호
TEL : 02-2039-6160  FAX : 02-2039-6163  사업자등록번호:106-86-40304
개인정보/청소년보호책임자:김선오  등록번호:서울 아 00418  등록일자:2007.08  발행인:김용석  편집인:김선오