데이터에 제값 매기는 데이터 품질 관리
[아이티데일리] “쓰레기를 넣으면 쓰레기가 나온다(garbage in, garbage out).” 데이터 업계의 오래된 명언 중 하나다. 질 낮은 기름이 자동차의 성능을 저하시키는 것처럼, 질 낮은 데이터는 분석의 결과를 신뢰할 수 없는 것으로 만들어 기업의 의사결정을 방해한다.
기업이 데이터에서 가치를 생산하고 비즈니스에 활용하기 위해서는 무엇보다 양질의 데이터를 대량으로 확보하는 것이 필수다. 데이터를 수집할 수 있는 채널이 늘어나면서 획득할 수 있는 데이터의 양은 폭발적으로 증가하고 있지만, 이러한 데이터들을 체계적으로 관리하고 활용할 수 있도록 일정 이상의 품질 수준을 유지하는 것은 쉽지 않다.
1부 - 지속 가능한 데이터 품질 관리 전략 마련하라
2부 - 접근성 높이려면 정확한 데이터 제공해야
3부 - 비즈니스 현황 반영한 데이터 거버넌스가 필요하다
철저한 품질 관리가 데이터 활용성 높인다
한편 데이터 분석을 보다 민첩하게 만들기 위해 데이터의 활용 주체가 IT 조직에서 비즈니스 조직으로 옮겨감에 따라, 데이터 전문성이 부족한 사용자들이 잘못된 판단을 내리지 않도록 항상 정확한 데이터를 제공하는 것은 무엇보다 중요해졌다.
이제 비즈니스 조직은 데이터 기반의 의사결정이 필요할 때 IT 조직에게 도움을 요청하지 않는다. 정확한 목적을 가지고 그에 필요한 데이터를 스스로 찾아 조립하며 인사이트를 생성한다. 이러한 체계에서 비즈니스 조직은 자연스럽게 데이터가 IT 조직의 자원이 아니라 자신의 자원이라고 여긴다. IT 조직은 비즈니스 조직이 데이터를 안전하고 편리하게 다룰 수 있도록 데이터 포털(Portal)과 같은 인프라를 구축하고, 그들이 해결하지 못하는 기술적인 문제에 직면했을 때 도움을 제공하는 지원 조직이다.
데이터의 활용 주체가 비즈니스 조직으로 넘어가게 되면 IT 조직은 바빠진다. 전문성이 낮은 비즈니스 조직들에 의해 기존 데이터들이 무분별하게 변화하거나 신규 데이터가 제멋대로 쌓일 수도 있기 때문이다. 데이터의 활용은 비즈니스 조직이 하지만 관리는 여전히 IT 조직의 일이다. 접근 권한 관리나 메타데이터 관리 등을 통해 데이터가 통제된 상태에서 관리되지 않는다면 데이터의 품질은 빠르게 낮아진다. 일정 이상의 품질이 보장되지 않는다면 데이터는 가치가 없어진다. 화려한 데이터 포털을 구축해 수많은 데이터를 검색하고 조합할 수 있더라도, 밑단에 있는 인프라와 관리지침이 지켜지지 않아 신뢰성을 잃으면 데이터의 가치는 허상에 불과하다.비즈니스 조직은 IT 조직과 달리 데이터에 대한, 더 나아가 IT 기술에 대한 전문성이 떨어질 수 밖에 없다. 많은 IT 업무들이 비즈니스 조직에게 넘어갔지만 여전히 핵심적인 관리 체계를 만드는 것은 IT 조직의 일이고, 데이터 품질을 유지하기 위해 근본적인 관리지침을 세우는 것 역시 IT 조직이 담당해야 할 업무다. IT 조직은 데이터 품질을 지속적으로 관리함으로써 전사적으로 좋은 의사결정이 내려질 수 있도록 간접적으로 지원할 수 있다. 비즈니스 조직이라는 요리사가 좋은 음식을 만들 수 있도록 주방 설비를 정비하고 좋은 재료를 준비하는 것이 필요하다는 의미다.
데이터 활용성 높이기 위한 전담 조직이 필요하다
명재호 엔코아 부사장
기업 내에서 데이터 품질을 지속적으로 유지시키고 관리하기 위해서는 이를 전담할 수 있는 담당 조직을 구성해야 한다. 이는 C레벨에서 데이터에 대한 의사결정을 내릴 수 있는 CDO(Chief Data Officer)일 수도 있고, IT 부서에 포함된 팀 단위의 조직일 수도 있다.
최근까지도 대부분의 기업들은 데이터 전문 조직을 갖추고 있지 않았다. 그러나 빅데이터 분석이 일반화되고 데이터에 대한 수요와 관리 필요성이 높아짐에 따라, 산업 분야별로 일부 선도적인 기업들은 데이터만을 전문적으로 다루는 팀을 구성하려는 시도에 나서고 있다.
이미 국내에서도 금융‧통신‧제조 등 핵심 산업 분야의 리더들은 사내 조직을 재편하고 외부 전문가를 수혈하면서 데이터 전담조직을 만들었다. 그동안은 IT 부서에서 데이터 업무도 함께 수행했지만 지금은 일부 기업들이 DA 담당 조직, 데이터 표준 담당 조직, 전반적인 라이프 사이클 관리 조직 등을 별개로 만들어나가는 추세다. 전체 IT업무를 관장하는 CIO에 더해 더욱 협소한 분야에 전문성을 가진 CDO를 두는 경우도 있다. 데이터가 기업의 생존에 직결되는 만큼 조직의 업무 프로세스를 데이터를 중심으로 바꿔나가는 시도로 보인다.
이처럼 민간에서 고무적인 시도들이 다수 보이는 반편, 공공 분야에서는 아직까지 안타까운 문제들이 많다. 특히 공공기관의 문제는 공무원들이 비리 예방 등을 위해 주기적으로 담당 업무를 순환한다는 점이다. IT 분야는 여타 업무와 달리 지식과 경험이 축적돼야 하는 전문 영역인데, IT 담당자 역시 순환보직이기에 2~3년 경험을 쌓아 업무에 익숙해지려고 하면 다른 보직으로 이동해버린다. 어느 정도 조직 내 데이터의 흐름이 보이고 개선할 수 있는 부분이 보일 때쯤 되면 본인의 의지와는 별개로 근무지나 담당 업무를 바꿔버리니 국가적으로 큰 마이너스가 아닐 수 없다.
최근 정부에서 데이터의 중요성을 내세우며 관련 직류를 신설한 것으로 알고 있다. 예를 들어 각 부처마다 외부에서 쿼터를 정해 도움을 구할 수 있는 데이터 전문관 제도 같은 것들이다. 정부가 정말 데이터의 중요성을 인식하고 공공기관에서부터 장기적인 안목으로 변화를 꾀하려고 한다면, 데이터 관련 업무가 필요로 하는 특성을 정하고 전문화된 조직이 구성될 수 있도록 개선해나가야 할 것이다.
엔코아는 국내 대표적인 데이터 컨설팅 기업이다. 그동안 컨설팅 서비스를 중심으로 비즈니스를 확장하고 레퍼런스를 쌓아왔지만, 최근에는 데이터 통합관리 솔루션 ‘데이터웨어(DATAWARE)’를 중심으로 자사의 기술력을 제품화해 전략적으로 활용하고 있다. 데이터웨어의 포트폴리오에 포함된 ▲엔터프라이즈 데이터 모델링 도구 ‘데이터웨어 DA#’ ▲데이터 품질 관리 솔루션 ‘데이터웨어 DQ#’ 등에는 오랫동안 축적된 엔코아의 노하우가 결합됐다는 평가다.
엔코아의 솔루션들은 컨설팅 비즈니스를 추진하면서 필요한 기능들을 단계적으로 쌓아 개발된 제품들이기에 높은 실전성을 갖추고 있다. 프로젝트 현장에서 데이터를 관리하던 아이디어들을 영역별로 결합해 개별 솔루션으로 만들고, 이를 데이터웨어를 중심으로 묶어 하나의 통합 솔루션으로 제공한다. 현직 데이터 컨설턴트들이 필요로 하는 기능들이 적극 반영돼 있기에 전문가들로부터 높은 평가를 받고 있다.
특히 데이터 거버넌스나 품질 관리 프로세스를 정립하며 꼭 필요한 데이터 모델링 도구를 갖추고 있다는 점이 장점으로 꼽힌다. DA#은 국내 비즈니스 환경에 최적화된 데이터 모델링 도구로, 다차원‧다계층에 걸쳐 입체적인 데이터 모델링과 분석이 가능해 데이터 로직을 빠르고 정확하게 표현할 수 있도록 돕는다. 기업은 뛰어난 성능의 모델링 도구를 중심으로 복잡한 데이터 관리 프로세스를 간소화하고 편리하게 정립할 수 있다.
위세아이텍은 국내에서 다수의 빅데이터 분석 프로젝트를 다수 수행하며 핵심 역량을 축적해왔다. 특히 최근 몇 년 사이에는 머신러닝과 인공지능(AI)을 활용한 데이터 전문 솔루션들을 출시하며 기업의 데이터 프로세스를 간소화하고 효율을 높이는 방안을 제시하고 있다.
위세아이텍은 메타데이터 관리 솔루션 ‘와이즈메타(WiseMeta)’와 데이터 품질관리 솔루션 ‘와이즈DQ(WiseDQ)’로 국내 데이터 품질 시장 확산에 대응하고 있다. 와이즈메타는 데이터 거버넌스 정립을 위해 필수적인 메타데이터 관리에 최적화돼있으며, ▲전사 데이터 표준화를 위한 단어 자동 분리 ▲데이터 분석을 통한 도메인 자동판별 ▲AI 기반의 유사용어 추천 및 정리 등이 가능해 사용자의 편의성을 높인다. 특히 최근 활용도가 높아지고 있는 NoSQL 데이터의 메타데이터 및 스키마 정보 관리가 가능하며, 범정부 데이터 플랫폼과의 연계 또한 가능해 향후 공공데이터 품질수준평가가 가속화될 경우 활용도가 증가할 것으로 보인다.
와이즈DQ는 위세아이텍의 핵심 역량 중 하나인 머신러닝 알고리즘을 적용한 데이터 품질 관리 솔루션이다. 기업의 업무규칙과 메타데이터를 분석한 룰 기반의 품질 측정은 물론, 머신러닝 알고리즘을 적용한 통계적 품질진단 기능은 사전에 입력되지 않은 데이터의 이상값도 탐지할 수 있어 기업의 데이터 품질 수준을 크게 높일 수 있다.


