정병오 데이터스트림즈 컨설턴트



연재순서


▲ 정병오 수석컨설턴트㈜데이터스트림즈 컨설팅팀

㈜데이터스트림즈 컨설팅팀



1회. 차세대 시스템 구축 프로젝트에서의 데이터 통합의 중요성
- 데이터 표준화, 데이터 이행, 클린징, 정보계 구축 등 주요 데이터 통합과제들에 대한 접근 방법 및 동향 등
2회. 데이터 표준화 및 메타데이터 기술발전 추세
- 데이터 표준화 체계 마련을 위한 다양한 노력들과 이를 지원하기 위한 솔루션으로서의 메타 데이터 관리시스템의 필요성 및 효과적인 적용방안
3회. 데이터 품질 관리의 다양한 접근 사례
- 기업의 데이터 품질관리를 위한 최근 동향 및 적용사례, 발전 방향
4회. 정보계 개발 이슈 및 실시간 처리 방안
- 최근 정보계 데이터 구축 추세로서의 실시간 요건반영을 위한 다양한 접근 사례
5회. SOA 기반의 데이터 거버넌스 아키텍처
- 최신 IT아키텍처로서 소개되었고 점차 보편화된 용어로 자리 잡아가고 있는 서비스 지향 아키텍처(SOA)에서의 데이터 관리 이슈 및 SOA에서의 다양한 데이터관리 솔루션 아키텍처에 대한 구축 방향성




메타데이터

메타데이터(metadata)는 일반적으로 데이터에 관한 데이터로서 정보자원의 속성을 기술하는 데이터를 의미한다. 즉, 메타데이터란 실제로 저장하고자 하는 데이터는 아니지만, 이 데이터와 직접적으로 혹은 간접적으로 연관된 정보를 제공하는 데이터를 나타내는 말이다.

일반적으로 메타데이터를 정의할 때 가장 많이 사용되는 표현으로는 "데이터에 대한 데이터", "정보자원을 설명하는 요소 집합" 등이 대표적이다. 이와 같은 메타데이터를 사용하면 사용자가 원하는 데이터가 맞는가를 확인할 수 있고, 쉽고 빠르게 원하는 데이터를 찾아낼 수 있다. 즉, 데이터를 소유하고 있는 측면에서는 관리의 용이성을, 데이터를 사용하고 있는 측면에서는 검색의 용이성을 보장받을 수 있기 때문에 메타데이터의 필요성이 더욱 높아지고 있다.

가트너(Gartner)는 2008년 10대 전략 기술 발표에서 앞으로 3년 동안 기업에 매우 큰 영향을 끼칠 수 있는 가능성이 있는 기술로 그린 IT와 함께 메타데이터 관리를'전략 기술'로 정의하였다. 또한 2009년 10대 전략기술에 포함된 비즈니스 인텔리전스(Business Intelligence)의 기반이 바로 메타데이터 관리이다.

메타데이터 관리는 기업 정보 인프라의 중요한 부분으로, 재사용, 일관성, 보전성과 공유성을 지속하기 위해 메타데이터의 최적화, 추상화 및 의미적 조정을 가능하게 한다.

메타데이터는 Business 메타데이터와 Technical 메타데이터에 대한 이해도를 향상시키고 데이터에 대한 중앙관리를 가능하게 하며 표준화된 용어로 사용자 인터페이스를 설계함으로써 시스템의 활용도를 향상시키는 목적을 가지고 있다.

메타데이터의 활용

동시다발적인 정보시스템의 개발과 전사 데이터 관리의 마인드 결여, 데이터 관리 인력의 부재 등은 기업의 데이터 품질을 저해하는 요소이다. 이러한 결과로 데이터의 중복 및 조직, 업무, 시스템 별 데이터 불일치가 발생하며, 차세대등 시스템 개발 시 데이터에 대한 의미 파악 및 지연으로 데이터 통합 및 시스템의 개발에 막대한 지장을 초래한다. 또한 시스템의 개발 후 정보시스템의 변경 및 유지보수에 상당한 애를 먹고 있다.

이를 해결하기 위하여 데이터 표준화 및 규격화를 위한 데이터 표준화 정책 및 지침, 관리프로세스와 조직을 기반으로 한 표준용어, 도메인, 모델, 데이터베이스의 라이프 사이클(life Cycle)을 관리하며, 각종 툴(Case Tool, ETL, BI, 형상관리 등)과의 연계를 통하여 표준화의 변경에 대한 영향분석을 수행한다. 이로 인해 명칭의 통일로 인한 명확한 의사소통이 증대하며, 필요한 데이터의 소재 파악에 소요되는 시간 및 노력이 감소, 일관된 데이터 형식 및 규칙의 적용으로 인한 데이터 품질향상, 정보시스템 간 데이터 인터페이스 시 데이터 변환 등의 비용이 감소 등의 효과를 볼 수 있다.


▲ 메타데이터 관리 구성







메타데이터의 발전방향

데이터 표준화 중심의 표준관리 및 준수여부를 체크해오던 메타데이터 관리 시스템은 조직의 전반적인 기업 정보 관리의 일환으로 여겨지며, 크게 3가지 형태로 발전을 하고 있다.

첫째, 메타데이터를 기반으로 한 데이터 품질관리이다. 데이터 품질관리는 ETL을 중심으로 한 데이터 정제 중심의 품질관리 활동에서 품질 평가 요소를 통한 현황분석, 표준화를 통한 데이터의 구조적 품질관리 등 보다 체계적인 접근이 수행되고 있다.

데이터의 구조적 품질은 단순히 참조 무결성이나, 유일성, 관계 검증 정도를 의미하는 것이 아니라 모델링 전문가는 물론 비즈니스 담당자에 의한 데이터 구조 정의가 필수적이다. 이를 위하여 메타데이터를 활용하여 용어의 속성(도메인)을 정의하고, Case Tool(모델관리)과의 연동을 통한 데이터간의 참조 관계 등의 정보를 정의하여 데이터 품질 활동에 활용한다.

또한 메타 정보를 데이터 품질관리 솔루션과 연동하여, 품질관리의 측정 및 대상 관리를 효율적으로 수행할 수 있도록 연계하며, CDC 및 애플리케이션 변경영향분석도구와의 연동을 통한 종합적인 데이터품질 상시 감시체제를 구축한다.

두 번째로 마스터데이터 관리이다. 조직 전반적인 기업 정보관리의 일환으로 Enterprise Information Management 전략은 메타데이터 기반의 마스터 데이터 관리 전략으로 연결되며, 고객 데이터 통합 및 상품정보 통합 등 마스터 데이터 통합으로 구현된다. 기존의 메타데이터 관리시스템은 통합코드 관리를 수행하며, 코드의 변경 및 주요 코드 정보의 Sync를 담당해 왔다.

이러한 메타데이터의 활용은 은행 및 보험, 제조 등 고객정보와 상품정보의 다양한 활용을 필요로 업종에서 기존의 메타데이터 관리 기능에서 확장된 형태의 데이터 관리 기능을 요구하게 된다.

더불어 메타 데이터 관리는 회사의 정보 인프라에 중요한 부분을 차지한다. 그것은 재사용, 일관성, 무결성 및 shareability를 지원하도록 하는 메타 데이터 리포지토리와 함께 애플리케이션 개발 프로젝트에 SOA로 확장하게 되는데 그것을 mDOSA(metadata Oriented Service Architecture)라 부른다.

세 번째는 비즈니스 프로세스 관리이다. BPM EAI 등 대부분의 솔루션들은 나름대로의 워크플로우(WORKFLOW) 기능을 가지고 있다. 이는 비즈니스 프로세스의 설계 및 운영 그리고 관리에 대한 중복의 문제를 가지게 된다. 이에 메타데이터 중심의 비즈니스 프로세스와 데이터를 다양한 관점에서 편집 가능한 형태로 잡아내고 관리할 수 있는 Needs를 접하게 된다.

주요 목적은 프로세스 관리와 프로세스의 검토 및 개선을 위한 협업을 지원하는 것이다. 이런 종류의 툴은 아직 프로세스 모델은 실행 시키지는 못하며, 모델의 표현 형식도 호환성을 가지지 못하고 있다. 이는 주로 프로세스 발견과 설계를 지원하는 것이고 프로세스 분석, 최적화 등의 실행 환경을 지원하지는 않는다. 따라서 메타데이터를 중심으로 한 Business Process의 관리는 매우 중요한 부분이라 하겠다.

위의 글을 통해 간단하게나마 메타데이터와 메타데이터의 활용 및 현재 발전 방향을 알아보았다. 메타데이터를 구축하는 목표는 간단하게 데이터의 품질을 향상시키는 것이라고 필자는 생각한다. 메타를 활용한 프로세스 관리, 데이터 관리 등 많은 활용 형태가 있지만 궁극적으로는 데이터의 생성과 가공 활용의 모든 단계에서 일관성 있는 데이터의 품질 확보라 할 수 있겠다.

다음 회에서는 데이터 품질관리의 다양한 접근 사례를 통하여 데이터의 중요성과 품질 확보방안에 대하여 알아보도록 하겠다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지