데이터 접근성 극대화하는 사내 데이터 포털
[아이티데일리] 오늘날 빠르게 변화하는 시장 환경에 대응하기 위해서는 민첩한 의사결정이 필수적이다. 그리고 이제 정확한 의사결정을 내리기 위해서는 데이터를 활용하는 것이 당연해졌다. 과거에는 기업의 흥망을 결정짓는 의사결정권자들만 복잡한 데이터 분석 보고서가 활용됐지만, 이제는 저번 달에 입사한 신입 직원도 팀 내 보고서에 데이터 분석 결과를 첨부하는 시대다.
이제 기업에게 있어 직원들의 데이터 접근성과 활용성을 높이는 것은 중요한 과제가 됐다. 이를 위해 손쉽게 사내 데이터를 검색하고 활용할 수 있는 데이터 포털에 대한 관심이 늘어나고 있다.
[데이터 포털①] 데이터 접근성 높이기 위한 포털 구축 활발
[데이터 포털②] 체계적인 데이터 거버넌스가 포털 성능 높인다
데이터 접근성이 민첩한 의사결정을 만든다
국가적으로 데이터 중심의 혁신을 도모하기 위해서는 다양한 데이터를 개방하고 공유해 데이터에 대한 접근성을 늘리는 것이 필수적이다. 정부에서는 이미 몇 년 전부터 공공데이터를 적극적으로 공개하고, 민간기업에서 수집‧생산된 데이터들도 서로 적극적으로 공유 혹은 거래할 수 있도록 다양한 플랫폼을 만들어나가고 있다. 특히 최근에는 사용자들이 보다 손쉽게 데이터에 접근하고 획득할 수 있도록 데이터 포털 구축에 무게를 싣고 있다. 행정안전부가 운영하고 있는 ‘공공 데이터 포털’, 서울시가 운영하는 ‘서울 열린데이터 광장’, 국토교통부가 최근 공개한 ‘국토교통 데이터 통합 채널’ 등이 대표적인 공공분야 데이터 포털이라 할 수 있다.
한편 민간기업들의 데이터 포털은 공공기관들과 성격이 조금 다르다. 공공기관들이 구축하는 데이터 포털은 기관이 보유 및 생산하고 있는 공공데이터들을 최대한 많이 공개해 민간에서 자유롭게 활용할 수 있도록 돕기 위함이라면, 최근 민간기업들이 구축하고 있는 데이터 포털은 내부적으로 데이터 활용도를 높이기 위한 방법으로 사용된다. 비즈니스 조직이 IT 조직을 통하지 않고도 손쉽게 원하는 데이터를 찾고 활용할 수 있는 채널로써 데이터 포털이 활용되는 것이다.
데이터 전문가의 부족으로 인해 셀프서비스(Self-Service) 형태의 데이터 활용은 이제 필수가 됐다. 셀프서비스는 비즈니스 조직이 IT 조직의 도움 없이도 직접 데이터로부터 인사이트를 찾아내는 것을 의미한다. 기존에는 비즈니스 조직이 데이터를 분석하고자 하면 IT 조직에게 요구사항을 제시하고 보고서를 기다려야 했지만, 셀프서비스 분석 체계가 갖춰져 있다면 비즈니스 조직이 직접 데이터를 찾고 분석할 수 있다. 이는 기업이 보다 민첩하게 비즈니스 인사이트를 창출하고 의사결정의 속도를 높일 수 있도록 만든다.
비즈니스 조직의 셀프서비스 데이터 분석
초창기 대부분의 셀프서비스 데이터 분석 형태는 IT 조직이 분석을 위한 데이터를 준비해 DW로 제공하고, 비즈니스 조직은 이렇게 준비된 데이터들을 활용해 원하는 분석과 시각화를 수행하는 형태로 이뤄졌다. 그러나 이런 형태는 IT 조직이 여전히 비즈니스 조직을 위한 데이터 추출을 지원해야 하고, 비즈니스 조직은 원하는 데이터를 얻기 위해 지속적으로 IT 조직과 마찰을 일으키게 된다는 점에서 한계가 있다.
특히 비즈니스 조직은 기존에 IT 조직에게 맡겼던 데이터 분석을 직접 수행하게 되니 업무가 가중되고, IT 조직은 데이터 전문성이 떨어지는 비즈니스 조직이 데이터에 접근한다는 점에서 부담감을 느낀다. 이 때문에 셀프서비스 분석에 대해 기업의 의사결정권자와 현업 직원이 서로 다른 평가를 내리곤 했다. 의사결정권자는 셀프서비스 분석이 가져다줄 민첩한 인사이트 창출을 기대하지만, 현업 직원 입장에서는 추가적인 업무를 떠맡았음에도 불구하고 큰 효과를 보지 못하기 때문이다.
하지만 최근에는 이러한 인식에 조금씩 변화가 생기고 있다. 비즈니스 조직이 직접 데이터를 다룰 수 있어야 한다는 인식이 확산되고 있는 것이다. 이는 비단 의사결정권자들의 인식에만 국한되는 것이 아니라, 비즈니스 조직에서부터 보다 빠르게 데이터를 분석하고 인사이트를 얻기를 원하기 시작했다는 점에서 의미가 있다.
이에 대해 한 업계 관계자는 “현대식 슈퍼마켓이 처음 생겼을 때 손님들은 스스로 물건을 바구니에 담아 계산대로 가져가는 것에 대해 불만을 가졌다. 이전까지는 카운터에서 물건을 주문하면 직원이 가져다주는 식이었다. 하지만 지금은 다들 셀프서비스 쇼핑을 하고 있다. 길게 늘어진 줄을 서서 직원이 물건을 가져주길 기다리는 것보다, 직접 필요한 물건을 찾는 것이 효율적이라는 것을 알게 됐기 때문”이라고 설명했다.
셀프서비스의 관점에서, 데이터 포털은 비즈니스 조직이 IT 조직의 도움 없이도 직접 원하는 데이터를 찾고 시행착오를 겪을 수 있는 인프라를 제공한다. 초창기 셀프서비스와 가장 큰 차이는 ‘직접 원하는 데이터를 찾는다’는 점이다. 초창기 셀프서비스는 비즈니스 조직이 분석이나 시각화를 할 수 있더라도, 이를 수행할 수 있는 데이터는 IT 조직이 준비해줘야 했기 때문이다.
한편 데이터 포털은 단지 데이터에 대한 전문성이 부족한 비즈니스 조직만을 위한 것은 아니다. 과거에는 데이터의 수집‧저장과 분석‧활용이 모두 IT 조직에 의해 이뤄졌지만, 최근에는 데이터를 관리하는 조직과 활용하는 조직이 분리되는 추세다. 즉 IT 조직은 데이터를 수집‧저장하는 관리 업무에 보다 전문성을 가지게 되고, 비즈니스 조직과 함께 데이터 분석 전문 조직이 구성돼 분석‧활용만을 수행하는 것이다. 이러한 관점에서 본다면 데이터 포털은 셀프서비스만이 아닌, 기업의 데이터 활용 능력을 전반적으로 향상시키기 위한 방법이 된다.
“데이터 포털은 검색 그 이상을 제공해야 한다”
김범 엔코아 전략사업본부 전무
최근 기업들 사이에서는 데이터 중심의 디지털 트랜스포메이션 프로젝트가 유행처럼 추진되고 있다. 하지만 이들이 기대한 만큼의 성과를 내고 있는 지에 대해서는 다시 한 번 생각해볼 필요가 있다. 많은 프로젝트들이 데이터를 활용하는 방법으로 챗봇이나 기본적인 고객 분석 자동화 수준에 머무르고 있다.
이것은 디지털 트랜스포메이션에 대한 기대치가 너무 낮았기 때문이다. 디지털 트랜스포메이션은 단순히 기존 업무가 조금 편해지는 수준이 아니라, 업무 프로세스 자체를 완전히 새롭게 혁신하는 수준에서 이뤄져야 한다. 이는 단발적인 프로젝트가 아닌, 장기적으로 기업이 데이터를 어떻게 바라보고 다룰 것이냐에 대한 전략의 문제다.
이에 따라 최근 선도적인 기업에서는 데이터 전문가들을 동원해 자사가 보유한 데이터들을 지속적으로 분석할 수 있는 체계를 만들고자 하고 있다. 장기적인 전략으로 추진하는 것이기 때문에 단발성 아웃소싱보다는 내부적인 인력강화가 두드러진다. 실제로 기업들이 굉장히 많은 데이터 분석가들을 채용하고 있어 공급이 따라잡지 못하는 수준이다.
기업이 데이터 전문가로 구성된 조직을 마련하게 되면 어떤 문제가 생길까? 이들은 기존에 기업 내에서 데이터를 수집‧저장‧관리하던 IT 조직과는 다르다. 따라서 데이터를 운영해온 IT 조직과 신흥 데이터 전문가들 사이에서 업무 괴리가 발생할 수 있다. 이들 사이에 체계적인 시스템이 없기 때문이다. 신입 데이터 전문가가 분석 업무를 하려는데, 원하는 데이터가 어디에 혹은 누구에게 있는지를 알 수 없고 어떻게 요청해야 하는지도 모르면 업무를 진행할 수가 없다. 이렇게 되면 소위 앞뒤가 바뀐 프로젝트, 다시 말해 실제 분석보다 데이터를 탐색하는 데에 더 많은 시간을 소비하는 프로젝트들이 발생한다.
이러한 문제를 해결하기 위해 최근 데이터 카탈로그(Catalog) 솔루션들이 성행하고 있다. 데이터 카탈로그는 기업이 보유하고 있는 데이터 자산을 인덱싱하는, 쉽게 말해 도서관에 있는 책 검색 PC 같은 기능을 제공한다. 하지만 책 이름을 모르면 도서관 검색 PC 대신 사서의 도움을 받으면 되지만, 기업에서는 해당 데이터의 검색어를 모른다고 해서 일일이 IT 조직의 힘을 빌릴 수는 없다. 데이터 카탈로그는 특정 문자가 포함된 정보만을 찾는 단순 검색 기능에 가깝다.
원하는 데이터의 정확한 검색 키워드를 모르더라도 여러 정보들을 조합해 찾을 수 있어야 한다. 이러한 관점에서 데이터 포털은 데이터 카탈로그를 한 걸음 넘어선다. 데이터 포털은 데이터 카탈로그가 가지고 있는 인덱싱 기능에 더해, 데이터들이 IT적으로 연관지을 수 있는 관계성을 정의하고 관리한다. 데이터 사이의 관계성까지 고려해서 찾아주기 때문에 더 사용자에게 필요한 데이터를 정확히 제공할 수 있다. 데이터들의 표준과 모델, 갖고 있는 데이터값들이 연관 관계를 가지고, 경우에 따라서는 분류체계의 정보관리, 적재요청에 대한 승인 프로세스까지 갖추고 있어야 검색의 정확성이 높아질 수 있다.


