11.20
뉴스홈 > 칼럼
[비즈니스 데이터 시각화] 지연 정보와 리드 정보엔코아 오성 컨설턴트

   
▲ 오성 엔코아 컨설턴트

[아이티데일리] 앞선 기고에서 ‘프로세스는 어떤 관점에서 시각화를 필요로 하는가’에 대한 질문과 답변을 통해 어떤 것을 시각화해야 하는지 알아봤다. 하지만 이 질문과 대답만으로 프로세스가 필요로 하는 시각화가 완전하게 도출되지 못한다.

앞선 질문과 대답은 ‘어떻게 시각화를 해야 하는가’를 도출할 수 있지만, ‘무엇을 시각화해야 하는가’를 정의하지 못하기 때문이다. 여기서 말하는 ‘무엇’이라는 것은 바로 시각화의 소스가 되는 정보를 말하는 것이다.

프로세스의 정보는 프로세스가 수행하면서 나오는 데이터를 기반으로 하며, 이를 시점으로 구분하게 된다. 과거의 데이터를 지속적으로 기록한 ‘지연 정보(Lag Information)’와, 프로세스를 새롭게 시작하거나 개선 방향을 제시할 수 있는 ‘리드 정보(Lead Information)’로 구분한다.


지연 정보와 리드 정보란

‘지연’이라는 단어의 의미를 보면 ‘어떤 일을 더디게 끌어 시간을 늦춘다’이다. 그리고 여기서 말하는 ‘지연 정보’라는 단어는 프로세스를 수행하면서 발생된 정보에 대한 것을 의미한다. 아무리 실시간으로 프로세스를 모니터링하더라도 이미 수행된 프로세스의 정보는 ‘지연’된 정보일 수밖에 없기 때문이다.

그렇더라도 이 지연 정보는 단순히 프로세스의 기록으로 끝나지 않는다. 지연 정보의 본래 목적은 우리가 목표를 충족하고 있는지, 그리고 이를 통해 프로세스에 대한 운영을 조정할 필요가 있는지를 모니터링하기 위함이다.

앞선 기고의 내비게이션 예를 보면, 지연 정보는 차량이 운행을 시작한 시점부터 발생해 현재까지를 의미한다. 이를 통해 운전자는 현재까지의 운행 현황을 보고 차량을 어떻게 운전할 것인지를 결정할 수 있기 때문이다.

이를 기업의 관점으로 바라보면 지연 정보는 데이터웨어하우스에 저장되고, 이를 활용해 분석과 학습하는데 사용된다. 그리고 본 기고에서 지연 정보의 가장 중요한 용도는 리드 정보를 생성하는 기본 데이터가 되기 때문이다.

‘리드 정보’는 지연 정보처럼 프로세스에 의해 생성되는 것이 아니라, 지연 정보를 기초로 해 미래에 프로세스가 수행될 때를 관점으로 생성한 것이다. 그렇기 때문에 이 프로세스가 어떠한 방향으로 움직이게 될지에 대한 추세와 어떠한 결과가 도출될 것인지에 대한 예측을 갖게 된다. 이러한 예측된 정보는 사용자로 하여금 프로세스를 개선하거나 새로운 프로세스를 시작하는데 사용된다.

리드 정보에도 품질이 존재하는데, 앞서 설명한 지연 정보도 품질이 있지만 크게 중요하게 바라보지 않는다. 이 의미는 업무 처리 관점에서 잘못 측정된 것이라면 문제가 있겠지만, 측정이 원활히 된다면 품질 자체에는 문제가 없기 때문이다.

하지만 리드 정보의 품질은 ‘얼마나 정확하게 예측한 것인가’에 따라 평가할 수 있다. 평가 방법은 리드 정보의 예측을 위해 필요한 변수는 모두 고려됐는지, 예측한 결과와 실제 나온 결과에 어느 정도 차이가 존재하는지 등이다.

그렇기 때문에 리드 정보의 품질은 이를 생성하는 분석 프로세스의 품질을 의미하기도 한다. 이러한 리드 정보의 특성은 매우 높은 통찰력을 가지고 있으며, 기업의 전략적 측면에서 이를 통해 학습의 기회를 제공하게 된다.

앞선 내비게이션의 예를 보면, 운행 정보를 데이터 마이닝 방법론을 통해 분석을 수행하게 되면 일찍 도착하거나 늦게 도착하는 이유에 대해 핵심 요인을 도출할 수 있게 될 것이다. 그리고 이를 통해 상관관계가 도출된 유의미한 지식은 미래에 원하는 목표에 도달할 수 있도록 도움이 된다. 기업에서는 이러한 분석 과정의 결과로 최신의 통찰력과 목표에 도달할 수 있게 될 것이다.


프로세스에 지연 정보와 리드 정보의 적용

우리는 이러한 지연 정보와 리드 정보를 프로세스에 적용해야 한다.

이 또한 두 가지 관점에서 바라볼 수 있는데, 앞선 내비게이션 예로 보면 ‘길을 출발하기 전’이던가, 아니면 ‘길을 가고 있는 중’으로 구분할 수 있다.

이를 프로세스의 관점에서 보면 ‘프로세스를 시작하기 전’과, ‘프로세스가 수행되고 있는 중’으로 구분할 수 있다.


프로세스를 시작하기 전의 지연 정보와 리드 정보

프로세스를 수행하는 이유는 목적을 달성하기 위함이다. 지연 정보로 프로세스를 모니터링하고, 리드 정보로 성과를 도달할 수 있을지 예측하는 자체도 목적을 달성하기 위함이다. 이를 통해 우리가 프로세스 시작하기 전의 관점에서 보면, 프로세스가 어떠한 성과를 낼지 예측을 필요로 하게 된다.

예시를 통해 보면, 길을 출발하기에 앞서 지연 정보를 활용해 어느 정도 시간이 소요될지를 예측하고 이를 통해 계획하게 된다. 이는 지연 정보의 본래 목적인 프로세스를 모니터링하기 위함이지만, 프로세스를 시작하기 전에는 예측을 위해 존재하게 된다. 그렇기 때문에 프로세스가 종료되더라도 여기서 발생되는 정보를 버리지 않고 데이터웨어하우스에 저장하고 관리하는 것이다.

우리는 길을 떠나기 전에 어떻게 하면 빠르고 쉽게 갈 수 있는 경로가 어떤 것이 있는지를 지연 정보를 바탕으로 생성된 새로운 리드 정보에서 찾게 된다. 그리고 새로운 리드 정보를 선택하고 이에 따라 길을 가게 되면, 이는 새로운 지연 정보를 생성하게 되는 것이다.

하지만 리드 정보가 알려준 길로 가는 것이 아니라, 자신이 알고 있는 다른 길을 따라 이동을 할 수 있다. 그렇더라도 이는 이동하는 경로에 대해 지연 정보를 생성해야 한다. 모니터링 관점에서 지연 정보를 생성할 때는 프로세스 관점에서 데이터를 생성해야 하지만, 리드 정보를 생성하기 위해서는 분석 관점의 지연 정보를 관리해야 한다.

길을 안내하는 관점에서 본다면, 많은 사용자가 지연 정보를 발생시킨다고 하더라도 출발점과 도착점이 동일한 경우는 매우 희박할 것이다. 그렇게 된다면 지연 정보를 바탕으로 리드 정보 생성이 어렵게 된다. 이를 분석의 관점에서 데이터를 수집하고자 한다면, 출발점과 도착점의 관점에서만 하는 것이라 아니라, 도로의 관점에서 데이터를 수집해야 한다.

즉, 우리가 관리하고 있는 데이터, 기준 정보를 기준으로 수집해야 한다. 단순히 출발점과 도착점에 대한 교통 체증 정보만이 아니라, 각기 다른 시간에 도로마다 시간이 얼마나 걸리는지 정보를 생성하게 되고 이동하게 되는 경로의 도로에 대한 트래픽을 측정하게 되는 것이다. 이를 통해 리드 정보를 생성할 것이며, 우리는 이동하기 전에 이동시간이 얼마나 소요될지를 예측하고 얼마나 달라지는지에 따라 계획을 세울 수 있다.

좀 더 고급스러운 표현으로 하면, 새롭게 생성된 리드 정보에 따라 내부 지식 학습과 이동에 대한 프로세스를 최적화할 수 있는 것이다. 이것은 단지 프로세스가 목표를 충족하는지 여부를 모니터링하는 것을 넘어, 지연 정보를 활용해 프로세스를 최적화하는 것이다. 그것만이 아니라 우리는 리드 정보에 대한 통찰력을 향상시키기 위해, 최신의 리드 정보를 분석 프로세스 개선을 위한 분석 정보로써 지연 정보로 저장할 수 있다.


프로세스가 수행되는 중의 지연 정보와 리드 정보

두 번째 관점은 지연 정보를 활용해 프로세스를 모니터링하는 것과 새로운 리드 정보를 생성하기 위한 것만이 아니라, 주어진 프로세스를 최적화하기 위한 전략적인 수용의 관점을 갖게 된다.

이는 프로세스가 수행되고 있기 때문에 이미 프로세스의 영향을 받고 있고, 그 과정에서 서로에게 미친 영향간의 상관관계를 설명할 수 있다. 그리고 저장된 지연 정보를 사용해 프로세스를 최적화할 수 있는 방법에 대한 지식을 생성할 수 있다. 이렇게 발생된 최신의 지연 정보를 기반으로 우리는 리드 정보를 주기적으로 생성할 수 있으며, 그 과정이 구조화돼 학습하는 과정이 학습 사이클로 유지될 수 있다.

길을 이동하는 경우를 학습하는 과정으로 고려한다면, 길을 이용하는 동안 연료 소모를 최소화하면서 운전시간을 최소화시킬 수 있는 것이다(또한 도로교통 위반정보도 수집할 수 있다). 이런 경우 분석의 관점이 두 가지가 되는데, 이는 분리해 생각해야 한다.

우리가 여행을 위해 관광버스를 이용한다고 생각해보자. 여행객 입장에서는 목적지까지 빠르게 도착하기 위해 좀 더 멀더라도 시속 150km로 이동해 한 시간 만에 도착할 수 있는 구간을 바랄 것이다. 하지만 여행사 입장에서는 교통사고 발생과 연료 소모를 최소화하기 위해 80km의 속도와 가장 짧은 거리, 2시간이 소요되는 구간을 원할 수 있다.

이처럼 분석을 활용하고자 하는 입장은 다양하기 때문에, 어떤 것을 최적화하고자 하는지 상세히 분리한 리드 정보를 생성하는 것이 유용하다.

인기기사 순위
(우)08503 서울특별시 금천구 가산디지털1로 181 (가산 W CENTER) 1713~1715호
TEL : 02-2039-6160  FAX : 02-2039-6163  사업자등록번호:106-86-40304
개인정보/청소년보호책임자:김선오  등록번호:서울 아 00418  등록일자:2007.08  발행인:김용석  편집인:김선오