[솔루션 리뷰] AIX 실현을 위한 데이터 거버넌스 솔루션 ‘DATAWARE 올인원(All-in-One) 패키지’
메타 데이터 관리에서 데이터 품질, 영향도 분석까지 한 번에 해결
[아이티데일리] 최근 IT 기술 트렌드는 생성형 AI가 대두되기 전과 후로 분명하게 구별할 수 있다. 기업과 기관은 그동안 시장에 나와 있는 다양한 생성형 AI를 활용해 보면서 생성형 AI를 적용하기 위한 방법을 고민해 왔다.
허깅 페이스에 공식적으로 LLM으로 분류된 모델을 리스트업 하지만 셀 수 있는 범위를 넘어서는 상황이다. 광범위한 언어 모델을 포함하면 그 수는 수십만 개에 이른다고 한다. 이 글을 작성하고 있는 시점에도 그 수는 지속적으로 증가하고 있다. 그러나 일반 기업과 기관이 이를 활용해 보는 것에는 한계가 있으며 실제 생성형 AI를 활용한다고 해도 내부 데이터의 통합과 관리의 프로세스를 거친 고품질의 데이터가 아니면 그 어떤 생성형 AI에 적용해도 양질의 결과를 얻기는 어려운 현실이다.
학습 데이터의 품질에 크게 의존하는 AI 알고리즘 때문에 데이터의 품질은 AI시대에 더욱 중요한 요소로 인식되고 있다. AI 적용 이전에 데이터 거버넌스 구축이라는 첫 번째 단추를 잘 채워야 하는 것이다. 체계적인 데이터 거버넌스는 데이터의 정확성, 안정성, 신뢰성을 보장해 AI 이니셔티브의 견고한 기반을 제공한다.
기업과 기관의 데이터 거버넌스를 구축하기 위해서는 시스템 구축과 구성원의 노력이 필요하다. 지속적이며 순환적인 데이터 거버넌스 프로세스를 수행하기 위해서는 반드시 해당 시스템의 구축이 필요하며 이에 대한 전사적인 공유와 인식이 필수적이다.
엔코아는 이러한 데이터 거버넌스 구축을 지원할 수 있는 데이터 거버넌스 솔루션군을 제공하고 있다. 특히 데이터 거버넌스 구축 프로세스에 필요한 메타 데이터 관리, 데이터 품질 관리, 데이터 흐름과 영향도 관리에 필요한 솔루션을 하나의 패키지로 제공한다. 데이터웨어 올인원(DATAWARE All-in-One) 패키지가 바로 그것이다.
올인원 패키지로 데이터 거버넌스 프로세스를 효율적으로 지원
데이터 거버넌스의 근본적인 목표는 전사적 비즈니스 요구사항을 충족하기 위해 신뢰할 수 있고 정확하며, 안전하게 접근할 수 있는 데이터 체계를 수립하는 것이다. 그리고 기업의 비전과 목표에 맞는 데이터를 확보하고 사용자가 원하는 요건에 적합한 서비스 환경을 구축하는 데 있다.
엔코아의 데이터웨어 올인원(DATAWARE All-in-One) 패키지는 기업의 데이터 거버넌스 수립을 위해 온프레미스(On-Premises)와 클라우드(Cloud) 환경에 최적화된 서비스 모듈을 제공한다. OS나 브라우저에 관계없이 사용할 수 있으며 모든 솔루션은 플러그인 형태로 쉽게 추가할 수 있어, 통합 웹 기반 관리 포털을 통해 효율적으로 운영할 수 있다.
또한 데이터 거버넌스 구축 프로세스에서 수반되는 데이터 정보들을 통합 리포지토리(Repository)로 관리하기 때문에 데이터 중첩을 최소화하고 유지보수 비용을 절감시킨다. 솔루션 간의 실시간 정보 교환이 가능해 협업을 극대화함은 물론이다.
이렇게 단일 플랫폼으로 데이터 거버넌스 구축을 가능하게 하는 데이터웨어 올인원(DATAWARE All-in-One) 패키지의 주요 기능들을 살펴보자.
메타 데이터 표준 관리로 일관되고 지속가능한 데이터 제공(META#)
올인원 패키지는 메타 데이터가 일관성 있고 체계적으로 유지되도록 하는 META# 솔루션의 주요 기능들을 모두 갖추고 있다. 데이터 표준 관리로 데이터 분석의 활용도를 높이고, 데이터 자산화를 촉진하며 향후 컴플라이언스 요구사항에도 효과적으로 대응할 수 있도록 지원한다.
● 표준-모델-구조 간의 연관정보 분석
표준 데이터, 데이터 모델, DBMS 간의 연관관계를 분석해 상호 간의 변경 영향도를 조회하여 데이터 안정화에 도움을 준다. 영향도 분석 도구 DATAWARE AP#과의 연계를 통해 소스코드 레벨까지 영향도 분석이 가능하다.
● DB 카탈로그 수집 및 추적 관리
DB 카탈로그 수집을 위한 서버 및 인스턴스 접속 정보 관리와 스케줄링에 의한 DB 카탈로그 수집 및 변경 추적 관리로 데이터 자산 수립 기반과 효과적인 메타데이터 관리 환경을 제공한다.
● 범정부 중앙 메타시스템과의 연계
기업의 메타관리 시스템과 범정부 중앙 메타관리 시스템과의 연계 기능을 제공한다. 수집 모듈을 통해 기관 메타데이터를 수집하고, 테이블/컬럼 단위의 전송 대상 상세 검토, 전송 결과 조회를 지원해 데이터 일관성과 정확성을 확보할 수 있다.
● 데이터 모델 DB 갭(Gap) 분석
승인된 모델과 개발/검증/운영 DB 간의 순차적 갭(GAP) 분석을 수행한다. 갭(GAP) 분석 결과를 바탕으로 테이블/컬럼 변경 내역을 확인하고 DDL을 자동으로 생성한다. DDL 생성 시 사전 설정한 부가 정보도 반영할 수 있다.
이 외에 올인원 패키지는 데이터 포털 AP#과 동시 활용으로 데이터에 대한 이해를 높여 더욱 체계적인 데이터 거버넌스를 구축할 수 있다. 동시에 지원되는 기능들은 다음과 같다.
● IT메타 BIZ메타 데이터 활용에서 검색어 통합 검색까지
IT 담당자에 의한 업무분류 및 비즈(Biz)용어 관리가 가능하며 비즈메타 명칭, 영문명, 관련 키워드를 정의한다. 비즈메타와 IT 메타의 매핑 연관 데이터셋을 지정해 통합 검색에 활용할 수 있다.
이를 통해 IT 역량이 부족한 사용자도 원하는 데이터를 손쉽게 찾고 이용할 수 있다. 연관 데이터셋을 지정해 통합 검색에 활용할 수 있다. 또한 데이터 포털을 통한 통합 검색을 지원해 구성원이 조직이 보유한 데이터에 손쉽게 접근할 수 있도록 데이터 포털 서비스를 제공한다. 최근/인기 검색어, 태그 등 사용자 편의성을 높인 검색 기능을 통해 데이터 리터러시 역량을 극대화한다.
이외에 전사 데이터 관리 현황을 한눈에 파악할 수 있는 대시보드를 제공해 데이터 운영의 투명성과 관리 효율성을 극대화한다. 전체 데이터에 대한 빠른 파악으로 신속한 의사결정 지원은 물론 데이터 품질 개선과 보안 리스크를 최소화할 수 있다.
데이터 품질 관리로 정제된 데이터 확보 지원(DQ#)
데이터의 신뢰성은 데이터 품질로부터 비롯되므로 데이터 품질관리는 기업의 데이터 거버넌스 전략에서 필수적인 요소다. 올인원(All-in-One) 패키지는 엔코아의 품질관리 솔루션 DQ#을 내재화해 기업의 중요한 자산인 데이터의 품질을 지속적으로 개선하고 관리한다.
● 품질관리를 위한 다계층 구조 지원
데이터 품질 진단 대상을 다계층 구조의 업무영역으로 구분해 업무영역에 대한 개별적인 권한을 부여한다. 이러한 품질진단 작업 관리와 작업 모니터링의 구분은 데이터 관리 효율성을 높인다.
● 데이터 품질지표(DQI), 핵심 품질 관리 대상(CTQ) 관리 지원
DQI 목록과 관련 진단 규칙을 조회해 데이터 품질지표(DQI) 관리를 지원한다. 또한, CTQ 목록과 할당된 업무 영역, 컬럼 정보를 조회하고, DB 서버별 컬럼 및 진단 규칙을 할당해 핵심 품질 항목(CTQ)을 체계적으로 관리한다. 이 과정은 데이터 품질 관리에 영향을 미치는 주요 요소들의 정확성을 보장한다.
● 스케줄링을 통한 주기적인 품질측정
데이터 프로파일링 및 규칙 기반 품질 진단 작업들에 대한 스케줄링(즉시 실행, 1회, 연/월/일 반복 등) 작업이 가능하다. 진단 작업에 대한 상세 정보 확인으로 컬럼 단위 매핑된 진단규칙, 프로파일링 설정 조회 등을 지원하며 주기적인 품질 진단 수행으로 고품질 데이터 유지를 돕는다.
● 품질진단규칙, 업무규칙 정의 및 오류 데이터 개선 관리
진단 대상 컬럼과 진단규칙을 매핑해 해당 컬럼에 대한 품질 진단을 수행하고 진단규칙 정보, 변경이력, 실행 SQL 조회 등 대상 컬럼에 대해 업무규칙/도메인규칙/관계규칙을 매핑해 관리한다. 또한 데이터 품질진단 결과를 조회해 오류 데이터가 발생한 테이블 및 컬럼 확인 그리고 상세 정보 확인이 가능하다. 해당 데이터 오류에 대한 원인 분석을 담당자에게 요청할 수 있으며 개선 작업의 진행 상황을 모니터링한다.
● 품질현황 및 추이 분석 등 통계 및 보고서
프로파일링 및 진단규칙 기반의 품질진단 실행 결과와 개선활동 현황 등을 품질 현황 보고서로 제공하고 있다. 다양한 관점과 가독성 있는 차트 활용으로 진단 결과에 대한 활용성을 증대시켜 준다.
데이터 흐름의 시각화로 데이터간 영향도 신속하게 분석(AP#)
정확하고 가치 있는 데이터를 획득하기 위해서는 데이터 흐름 분석과 상호 영향도 분석이 반드시 필요하다. 해당 과정이 없다면 전체 시스템의 안정성을 보장하기 어려우며 특히, 새로운 시스템의 도입이나 기존 시스템 변경 시 예상치 못한 오류나 성능 저하 발생 등의 위험 발생 가능성이 높아질 것이다. 기업은 전문적인 데이터 흐름 및 영향도 분석 솔루션을 통해 이러한 위험 요소를 최소화하는 것이 중요하다.
● 데이터 흐름 시각화
데이터 거버넌스(Data Governance)는 애플리케이션 소스코드와 DB 오브젝트 간의 영향 관계를 시각화된 다이어그램으로 제공하며 특정 테이블 혹은 소스코드 파일에서 시작해 호출/피호출 관계를 단계적으로 보여준다.
● DB-소스코드 상호 영향도 분석
데이터의 소스코드 및 DB 카탈로그 수집으로 형상관리 시스템과 파일 시스템에서 애플리케이션 소스코드를 수집 및 파싱하여 영향도 분석을 수행한다. 이 DB 오브젝트에서 애플리케이션에 이르기까지 전체 흐름 및 영향도 정보를 파악할 수 있다. 그리고 수집한 소스코드와 DB 카탈로그 정보를 응용분류로 구분하여 체계적인 관리를 지원한다.
● 통합 리포지토리(Repository)로 SQL, 문자열, 주석, DB 오브젝트 등 검색
클래스, 함수, 변수 등 소스코드 내에 정의된 객체를 검색하는 기능을 제공한다. 통합 리포지토리(Repository)로 수집한 소스코드 정보를 활용해 보다 빠르고 다양한 검색 기능을 사용할 수 있다. 필요한 정보를 신속하게 찾을 수 있어 업무 효율성 향상에 기여한다.
● 애플리케이션 상세 정보 조회
애플리케이션 상세 정보 조회를 통해 소스코드에 대한 영향도 분석 결과를 포함하여 소스코드 사용 객체 정보, 클래스 다이어그램, 사용 SQL 정보, 파일 영향도 정보, 소스코드 및 함수 호출 관계, Include/Import 정보 등 탭 별로 다양한 정보들을 확인할 수 있다.
정밀한 정보 파악과 애플리케이션 분석으로 시스템 간의 오류를 예방해 준다. 또한, 사용 객체, Include/Import, 파일 사용도/영향도, 클래스 다이어그램, 사용SQL, 소스변경 이력 등 탭 별로 구체적인 파일 정보를 조회할 수 있다. 시스템 간 데이터 연관성을 명확히 파악할 수 있어 유지보수가 용이하다.
● 모델/매핑정의서 분석해 내/외부 시스템간 흐름 정보 시각화
모델 정보 및 매핑정의서를 통해 전사적인 데이터 흐름 정보를 수집하여 관리한다. 테이블/컬럼 및 시스템 간의 데이터 흐름 정보를 시각화해준다.
● DB별 다양한 통계 및 보고서 제공
애플리케이션 자원 통계, 자원 집계 현황, 프로그램 목록 등 다양한 영향 분석 결과 보고서를 제공한다. 미사용 프로그램 현황, 파일/함수 복잡도 등 시스템 운영 및 관리 최적화에 활용 가능한 보고서를 제공한다. 의사결정의 기반이 된다.
2025년 엔코아가 선보이는 데이터웨어 올인원(DATAWARE All-in-One) 패키지는 기업과 기관이 데이터 거버넌스 일련의 프로세스를 구축하기 위하여 각각 구축하던 메타 데이터 관리, 데이터 품질 관리, 영향도 관리를 보다 손쉽고 효율적으로 구축할 수 있는 환경을 제공하기 위한 제품이다. 각 솔루션은 유연한 연계가 가능하며 데이터 모델링 툴 DA#과 연계해 더욱 효과적인 데이터 거버넌스를 구축할 수 있다.
데이터 거버넌스는 각각의 프로세스가 유연하게 연결되고 지속적으로 관리되어야 고품질의 데이터를 얻을 수 있다. 각각의 개별 프로세가 모두 중요하며 이 모든 프로세스가 제대로 구축되었을 때 온전한 데이터 거버넌스가 구축되었다고 할 수 있으며, 기업은 양질의 데이터를 기반으로 AIX의 국면에서 미래지향적인 의사결정이 가능하게 된다.