엔코아 오성 컨설턴트

 

▲ 오성 엔코아 컨설턴트

[아이티데일리] 데이터 시각화는 다양하게 접근할 수 있다. 여러 방법 중 하나는 데이터 분석을 수행하고 이 내용을 다른 사람들이 손쉽게 이해할 수 있도록 시각화하는 것이고, 다른 하나는 기업의 프로세스와 성과 및 위험 요인 등의 다양한 지표를 모니터링하기 위해 업무를 분석하고 이에 적합하게 시각화하는 것이다.

여기서 설명하는 ‘비즈니스 데이터 시각화’는 후자의 시각화 접근 방법을 의미한다. 물론 최근의 빅데이터와 데이터 분석 관련 기사를 보면 데이터에서 시작해 답을 찾고자 하는 방법, 즉 전자의 방법이 대부분이다. 그리고 이러한 접근 방법이 ‘데이터 사이언티스트’의 역할이라고 정의하고 있다. 물론 이러한 방법이 ‘잘못됐다’는 것은 아니지만, 이를 통한 접근 방법이 적절하고 효과적인지는 다시 한 번 짚어봐야 할 필요가 있다.

첫째, 데이터 사이언티스트가 사전 지식이 없이 데이터에서 발굴해낸 지식은 오랫동안 업무를 담당한 직원이라면 이에 대해서 이미 알고 있을 확률이 높기 때문이다. 단지 다른 부분은 오랫동안 이를 알고 있는 현업 담당자가 도출해 접근하는 것과 ‘데이터 분석’이라는 기술에 이목이 집중된 상태에서 이를 데이터로 증명해 밝혀냈다는 것의 차이일 수도 있다는 것이다(더 근본적인 이유를 말하자면 ‘경영진의 지원을 받고 있느냐’의 차이다). 데이터 분석에 이목이 집중돼있다는 것은 회사에서 투자를 진행해 프로젝트를 진행하고 있다는 것이고, 데이터 탐색을 통해서 도출된 것은 담당자만 알고 있지 다른 사람들은 모르는 ‘데이터 인사이트’라는 것으로 보이기 때문이다(아무도 모를 수 있긴 하다).

이렇듯 과대한 비용을 지불하지 않고 동일한 효과를 얻을 수 있는 방법은 내부에 잠재돼있는 인사이트에 대해 발굴할 수 있는 방법이 있어야 한다. 이는 기업이 평소에 노력해야 하는 부분이다. ‘데이터 사이언티스트’를 통해서 시작하는 것이 아니라 내부의 직원을 통해 시작해야 하는 것이고, 데이터 사이언티스트가 이를 도와서 정확한 근거와 함께 일을 해야 하는 것이다. 그리고 기업은 수시로 직급과 역할에 상관없이 다른 부서와 상위로 인사이트를 개진할 수 있는 프로세스가 존재해야 한다.

둘째, 데이터부터 접근하는 방식은 근본적으로 bottom-up 방식이다. 이는 특정 상품 또는 서비스를 개발하기에 적합할 수 있으나 이를 기업 내부의 프로세스와 성과, 위험 요인에 대해 접근하고자 한다면 정보가 누락될 가능성이 높다. 성과와 위험 요인의 기본 바탕에는 ‘측정’이라는 지속적으로 관찰하고, 변동에 따라 내부의 프로세스가 움직여줘야 한다는 전제가 있기 때문이다. 이러한 ‘측정’이 다양한 위치에서 근무하는 직원들에게 다른 수치가 제공된다면 서로 다른 의사 결정을 내릴 수 있기 때문이다. 그렇기 때문에 데이터에서 시작되는 접근은 위험하다.

마지막으로, 아무도 관심을 가지지 않는 데이터에서 새로운 사실을 밝혀낼 수 있다. 그러나 이는 역으로 살펴보면 결과에 맞춰 원인을 끼워맞추기 식으로 찾아낸 것일 수 있다. 밝히고자 하는 사실과 관심을 가지지 않는 데이터 사이의 연결 고리를 찾아내는 것은 최종적으로 잘못된 결과를 가져올 수 있다. 실제는 아무 상관이 없는 데이터인데 이를 가지고 인과관계라 생각할 수 있기 때문이다. 이처럼 데이터에서부터 접근하는 것은 모르고 있던 패턴을 찾아내기에는 적합하나, 실제 찾아낼 수 있는 양이 적고, 많은 프로세스에 대해 적합한 시각화 방법을 찾기 위해서는 부적합하다고 할 수 있다.


비즈니스 데이터 시각화를 위한 3가지 질문

그렇다면 우리는 비즈니스 데이터 시각화를 위해서는 어떻게 접근해야 하는 것인가? 앞서 비즈니스 데이터 시각화가 지원하는 것은 ‘프로세스’라는 것을 말했다. 프로세스에 대한 분석은 우리가 수행하는 프로세스에 대해 이를 효과적으로 측정하고 모니터링할 수 있도록 하는 것이다. 이를 위해서는 비즈니스 관점에서 아래의 세 가지 질문을 하고, 이에 대응하는 기능을 답해야 한다.

 1. 프로세스는 어떠한 상태(Status)인가?
 2. 프로세스는 어떠한 동향(Trend)를 가지고 움직이는가?
 3. 프로세스는 어떻게 될지 예상(Projection)되는가?

운영되는 프로세스가 효과적으로 측정되고 있다면 위 3개 질문 범주에서 답할 수 있어야 한다. 우리에게 가장 익숙한 시각화 기기인 자동차 내비게이션을 생각해보자. 내비게이션에서 원하는 곳까지 길만을 안내하는 것이 아니라, 예상 도착시간과 과거와 현재의 도로 지체정보 및 평균속도, 운전자의 피로도와 연비를 고려해 최단거리 및 고속도로 이용 등 다양한 기능이 있다. 그렇다면 원하는 목적지까지 안내한다고 가정하고 현재 시점에 초점을 맞춰 질문을 재구성해보자.

 1. 현재 어느 정도까지 도착했는가?
 2. 속도는 일정하게 가는가? 아니면 올라가고 있거나 내려가고 있는가?
 3. 현재 내 속도를 감안할 때, 도착지까지 예상시간 안에 도착할 수 있는가?

첫 번째 질문은 현재 운행상태를 물어보는 질문으로, 예측됐던 운행속도에 비해 현재 어느 정도에 위치해있는지 확인하는 것이다. 이는 현재 속도만을 의미하기보다는 출발 위치에서 현재 위치까지 어느 정도 왔는지 확인하고, 예상했던 것과 비교해 어느 상태에 있는가를 확인할 수 있게 해주는 것이다.

두 번째 질문은 현재까지의 운행상태가 미래에 어떻게 반영될 것인지를 질문하는 것이다. 운행에 대한 최초 예상은 과거 동일 시간대의 교통상황 정보를 기준으로 했고, 이를 통해 미래 운행되는 동안 출발지점에서 도착지점까지 소요시간을 예측한 것이다. 이 최초 예측은 실제 운행할 때 예측한 결과대로 나올 수 있고, 아니면 변할 가능성도 있다(거의 모든 사람은 내비게이션이 정확히 시간을 예측할 것이라고 생각하지 않는다).

예를 들어 올림픽대로를 지나간다고 하자. 내비게이션은 지난 3개월 동안 동일 시간대의 차량 운행속도와 현재 도로를 지나가는 차량의 운행속도를 기준으로, 미래에 여기를 지나가는 동안의 속도는 어떻게 변할지를 통해 예상 도착시간을 계산할 것이다. 하지만 이는 최초 운행 이전의 예상 도착시간을 계산한 것이므로 운행되는 동안 교통정보를 반영하지 못한다. 그렇기 때문에 운행이 시작되면 현재까지의 운행정보와 새롭게 갱신된 도로상황을 기준으로 시간을 재산정하고, 이를 통해 운행시간이 더 걸릴지, 더 빨라질지에 대한 추세를 예측하는 것이다.

그러므로 이는 예측한 정보와 실제 운행되는 차량의 특성을 반영해야 할 것이다. 내비게이션은 운전자가 100km/h의 속도로 운행할 수 있다고 예측했고 현재 도로상황은 이 속도로 운전이 가능하다고 판단이 되지만, 운전자가 과속운전을 할지 저속운전을 할지는 모르게 되는 것이다. 이는 차량이 운행이 되고나서부터 반영을 할 수 있기 때문에 최초 예측에 운행정보를 지속적으로 반영해 실제 운행에 대한 추세를 생성하는 것이다.

마지막 질문은 그렇다면 예상 도착시간 안에 도착할 수 있는지를 보는 것이다. 이에 따라 운전자는 여러 가지 상황 판단을 할 수 있게 해준다. 가령 시간이 오래 걸릴 것 같아서 자신을 기다리고 있을 사람에게 연락을 하던지, 예상 시간보다 빨리 도착할 수 있을 것 같아 휴게소나 주유소에 들릴 수도 있을 것이다.

이렇듯 내비게이션이 단순히 길을 안내만 하는 것은 아니다. 최초에 도착시간을 예상하고, 운행상황에 따라 지속적으로 어떠한 추세에 있는지, 예상시간 안에 도착할 수 있는지를 예측하게 된다. 위 질문의 주요 초점인 상태, 동향, 예상의 세 가지 관점에서 프로세스를 바라보면 어떤 정보가 필요한지를 알 수 있고, 시각화할 대상이 분명해진다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지