특정 연령대 편중 우려 있지만, 여론 잘 파악할 수 있는 증거 되기도

▲ 강용성 와이즈넛 대표
[컴퓨터월드] 투표율이 표심을 읽는 바로미터로 여겨질 때가 있었다. 예를 들어 투표율이 높으면 야당에 유리한 것이고, 투표율이 낮으면 여당에 유리하다는 식의 해석을 근거로 한 주장이 그것이다.

그러나 최근 들어 투표율이 표심을 읽는 바로미터로 보기 어렵다는 지적이 이어지고 있다. 연령별 인구 구조가 바뀐 것도 그 원인이 될 수 있겠으나, 한가지 분명한 것은 기존 ‘투표율’에서 이제는 ‘선거 빅데이터’로 바로미터의 쉬프트 현상이 일어나고 있다는 것이다.

이미 미국, 유럽 등의 국가에서는 트위터, 페이스북, 블로그 등 소셜 미디어를 중심으로 한 선거 빅데이터가 선거의 판세를 가늠하고, 표심(心)을 움직이게 하는데 활용되고 있을 만큼 민심(心)을 읽는 바로미터로 활용되고 있다.

▲ 초이스2014로 살펴본 서울시장 넷심 결과 (집계 기간 : 14.5.11~14.6.3)

‘투표율’에서 ‘선거 빅데이터’로 민심 읽는 바로미터 변화
하지만, 선거 빅데이터를 이야기할 때 주로 미국 대선의 빅데이터 활용사례를 들어 왔지만, 국내에서는 개인정보 수집과 이용이 자유로운 미국과 달리 미국 식의 빅데이터 모델 활용이 적합하지 않다는 문제가 있다. 국내의 경우 데이터 및 데이터 운영환경, 언어, 데이터 활용의 규제 등으로 해외와는 다른 여건에서 소셜 미디어(블로그, 카페, 트위터 등)만을 표본으로 하고 있기 때문이다.

이로 인해 한국 실정에 맞는 한국형 선거 빅데이터 대한 관심이 높아지고 있다. 한국형 선거 빅데이터라고 해서 별도의 데이터가 따로 있는 것이 아니라, 후보자에 대한 데이터에 기존에는 다루지 못한 많은 데이터, 그리고 한국 특유의 문화와 언어 등이 포함된 것이라 이해하면 좋을 것이다.

그런 의미에서 지난 6월4일 동시지방선거는 유권자의 넷심(心) 등 한국형 선거 빅데이터 분석으로 표심(心)을 읽기 위한 좋은 시험 무대였다. 6.4동시지방선거는 광역단체장선거, 광역의회지역구 및 비례대표선거, 기초단체장선거, 기초의회지역구 및 비례대표를 뽑는 지방선거와 교육감선거 등 모두 7개의 선거로써 각 지역구의 후보자들은 유권자들의 표심(心)을 잡기 위해 선거기간 내 총력전을 펼친 바 있다.

그렇다면, 한국형 선거 빅데이터는 과연 선거 결과를 미리 예측할 수 있었을까? 와이즈넛은 6.4전국동시지방선거 후보자 등록이 마감된 이후인 5월17일 부터 선거 전날인 6월3일까지 빅데이터 기술로 2014 전국동시지방선거 후보자들의 온라인 영향력을 보여주는 한국형 선거빅데이터 분석 사이트 ‘초이스 2014’ 서비스 사이트를 운영했고, 선거가 끝난 뒤 한국형 선거빅데이터 분석을 통한 넷심(心)과 선거 득표 결과인 표심(心)과의 비교 결과를 발표했다.

▲ 초이스2014는 유권자 넷심(心)분석으로 7개 선거구의 표심(心)을 적중했다.

그 결과, 전국 선거구중 ‘초이스 2014’에서 분석한 관심지역 11개 선거구와 서울시 교육감선거에서 서울시장, 광주시장, 대구시장, 세종시장, 경기도지사, 제주도지사의 광역단체장과 서울시교육감의 당선 여부를 맞췄다.

특히, 서울시장, 광주시장, 대구시장 당선인의 경우 득표결과와 9% 미만의 차이였으며, 세종시장, 경기도지사, 제주도지사 당선인의 경우 20%대, 서울시교육감의 경우 불과 17% 차이가 나는 등 넷심(心) 분석만으로도 판세와 민심(心)까지 바라볼 수 있었다는 평을 얻었다.

특히, 와이즈넛은 이번 지방선거 관련 한국형 빅데이터 선거분석서비스를 제공하고자 후보자에 대한 관심도 지수(BAI)와 신뢰지수(BTI), 매체 총노출 지수(BVI) 등을 자체 개발하기도 했다.

한편, 인천시장, 대전시장, 울산 시장 등 5곳의 경우는 선거 결과와 넷심(心)으로 살펴본 판세가 뒤바뀐 결과를 보여 다음 선거 전까지 개선 및 보완해 적중 확율을 높여야 하는 과제를 남기기도 했다.

온라인 노출, 호감도, 신뢰도, 관심지수 등 유권자 넷심(心) 다차원 지수분석
그럼에도 불구하고 초이스2014는 시장, 도지사, 교육감 등 이번 선거 각 부문 후보자들에 대한 온라인 노출, 호감도, 신뢰도, 관심지수 등 유권자의 넷심(心)을 다차원 지수분석을 통해 6월4일 전국동시지방선거의 판세를 가늠하고 민심(心)의 향방을 살펴봤다는 점에서 시사하는 바가 크다.

대표적인 예로, 서울시장 후보인 박원순 후보의 경우 5월22일 “셔츠에 배낭 매고 선거유세길 나서…”에 대해 전날 대비 정치인관심도지수(BAI)의 긍정지수와 매체노출지수(BVI)가 각각 35%, 15% 증가했다.

▲ 실제 이슈에 따라 영향을 받는 BAI(정치인 관심도 지수) 예: 박원순 서울시장후보
한편 정몽준 후보는 5월13일 “정몽준 아들 발언에 “철없는 아들 너그럽게 용서해 달라” 눈물 쏟아…”에 대해 전날 정치인관심도지수(BAI)의 긍정지수와 매체노출지수(BVI)가 각각 17%, 66% 증가했다.

▲ 실제 이슈에 따라 영향을 받는 BAI(정치인 관심도 지수) 예: 정몽준 서울시장후보
물론 소셜 미디어 데이터가 특정 연령대에 이용자의 편중이 있을 수 있다는 우려가 있기는 하지만, 오히려 이는 해당 연령대의 여론을 가장 잘 파악할 수 있다는 증거로 볼 수 있는 것이다.

비록 소셜 미디어만의 분석을 통한 넷심(心)으로는 완벽히 표심(心)을 읽는데 아직 한계가 있지만, 소셜 미디어는 쉽게 형성되고, 주제가 다채롭고 쉽게 변경되며, 빠른 소멸이 된다는 점, 그리고 소셜 미디어를 통해 점차적으로 다양한 세대가 소통함으로써 각 세대별 유권자의 참여가 확대되고 있다는 점에서 한국형 선거 빅데이터가 향후 각종 선거에서 지속적인 주목을 받게 될 것으로 기대하고 있다.

한국형 선거 빅데이터의 필요 조건
한편, 한국형 선거 빅데이터가 넷심(心)으로 표심(心)을 읽어내기 위해서는 다음과 같은 필요 조건이 있다. 먼저, 빅데이터 분석의 가장 기본은 데이터의 양이다. 현재의 데이터 분석에서 100% 정답을 내놓을 수는 없지만, 많은 데이터 속에서 공통점을 찾아낼 수 있기 때문에 더 많은 데이터 분석을 한다면 지지도, 호감도 등 후보자에 대한 한층 더 의미 있는 정보를 제공할 수 있을 것이다.

둘째, 빅데이터를 바라보는 시각의 변화가 필요하다. 즉, 빅데이터를 가지고 무엇을 할 것인지에 대한 데이터 자체의 가치와 활용에 중점을 둬야 한다. 만약 데이터를 분석하는 기업들이 동일한 패턴으로 분석한다면, 모두 똑같은 인사이트를 얻을 것이기 때문에 같은 데이터라도 다르게 읽어낼 수 있는 접근 방식을 필요로 한다. 이를 위해 데이터의 축적 및 자원화, 데이터를 저장하고 처리/분석하는 기술, 통찰력을 통해 데이터에서 가치를 뽑아내는 인문학 등 다양한 분야의 인재확보가 필요하다.

이러한 맥락에서 와이즈넛이 이번에 선보인 ‘한국형 선거빅데이터 분석사이트-초이스2014’는 데이터 속 인간이 가지고 있는 생각, 담겨진 이념을 찾는 것이고, 기존 데이터를 단순 기계적이며 계산적이라고 생각했던 것에서 가장 인간적인 면을 찾아 바라보고자 하는 변화의 시작이었다고 볼 수 있다. 이러한 변화의 시도는 인간의 본성에 따른 합리적 의사 결정을 예측할 수 있는 것으로 이어질 것이고, 이것이 바로 민심(心)을 읽는 바로미터인 “한국형 선거 빅데이터”가 될 것이다.

* [용어설명]
- 정치인 관심도 지수(Buzzinsight Attention Index ; BAI)
- 정치인 신뢰지수(Buzzinsight Trust Index ; BTI)
- 매체 총노출 지수(Buzzinsight viral index ; BVI)

‘초이스2014’는 와이즈넛의 빅데이터 수집솔루션(와이즈 빅크롤러), 빅데이터 분석솔루션(와이즈 빅에널라이저)와 형태소분석기술, 텍스트마이닝 기술, 자연어 처리 기술 등이 집약된 것으로 트위터, 블로그, 카페 등에 올라온 선거 후보자 관련 일일 약 7만5천여 버즈를 수집하고, 수집된 정보의 긍/부정 분석 결과를 종합해 니어 리얼타임(near real time)으로 인품, 자질, 지지도 등 항목별 넷심(心) 성향분석과 후보자간 비교 및 일자별 변화 추이, 버즈의 전파 경로 등을 시각적으로 제공한 한국형 선거빅데이터 분석 사이트 이다.

 

저작권자 © 아이티데일리 무단전재 및 재배포 금지