[아이티데일리] 지난 2년여 시간 동안 빅 데이터에 대한 관심은 매우 빠른 속도로 꾸준히 증가해 왔다. 여기에는 빅 데이터 자체의 필요성에 더해 국내외적 정치 환경도 영향이 있었다. 미국에서 선거를 거쳐 오바마 정부가 출범하고 국내에서도 새 정부가 출범하며 새로운 방향성을 제시해야 하는 시기가 이 기간과 겹쳐 있었다.

하지만 그런 관심도, 인터넷 검색량을 나타내는 도표의 구글 트렌즈 지표가 보여주듯이, 이제 개념 확산의 정점을 지나가기 시작하는 듯 보인다. 이는 한편으로 이제는 좀 다듬어진 의미로 빅 데이터라는 이름이 이야기되고 이해 될 시점이 되었음을 시사한다.

▲ 구글 트렌즈의 빅 데이터 키워드 검색 추이(2013년 10월 3일 기준)

빅 데이터라는 단어는 흔히 주로 ‘거창한’의 의미를 담은 일종의 형용사처럼 사용되고 있다.

‘빅 데이터를 분석해보니 어떠하더라’ 또는 ‘빅 데이터를 활용하여’ 라는 식의 표현이 그런 경우이다. 무언가 좀 방대한 규모로, 체계적으로, 또는 다소 복잡한 분석을 했다는 의미를 강조하기 위해 빅 데이터라는 단어를 붙여주는 것이다.

사실 이런 경우 빅 데이터라는 단어를 빼도 내용은 달라지는 것이 전혀 없다. 단순한 치장일 뿐 별 의미가 없는 허무한 활용이다. 다만, 일부 경우에서는 ‘빅’이라는 의미와 어울리게 하기 위해 간단한 통계 알고리즘이라도 적용하거나 조금은 색다른 시각화가 가미되기도 한다.

두 번째는 소셜 미디어 데이터를 사용하는 것을 의미하는 경우이다. 소셜 미디어의 경우 ‘빅’ 측면의 특성을 가질 수도 있겠으나, 일부 ‘스몰’ 데이터를 가져다 사용하는 경우에도 ‘빅’이란 표현을 쓰면서 혼란을 야기하기도 한다. 실시간도 대량도 아니고 다양성도 높지 않음에도 ‘빅’이란 이름을 붙인다.

마지막은 오픈 소스/하둡을 사용하는 것만을 ‘빅 데이터’라고 부르는 경우이다. 지극히 기술적인 관점에서 의미를 한정한 경우이다. 오픈 소스를 사용하지 않았으니 다른 누군가의 프로젝트는 빅 데이터라고 부르면 안 된다고 질타하는 주장들이 이런 관점에서 심심치 않게 나온다.

형식보다는 결과를 위한 빅데이터 되어야
대략 이런 세가지 정도의 의미로 ‘빅 데이터’라는 단어가 사용되다 보니, 이전에도 해오던 일들에 빅 데이터라는 수식어를 붙이면서 고민에 빠지는 안타까운 경우가 흔하다.

빅 데이터라는 단어를 누구나 사용하는 분위기이고 빅 데이터와 관련되어 무언가 할 일을 찾아서 제시하라는 조직 내외부의 압력도 받다 보니 궁여지책으로 오랫동안 해오던 데이터 분석 관련된 업무에 ‘빅 데이터 활용’, ‘빅 데이터 기반’ 이라는 표현을 붙인다. 그러나 마음이 편하지만은 않다. 누군가 마음먹고 따지고 들면 할 수 있는 설명이 궁색하기도 하고 스스로도 차이를 잘 모르겠다는 불편함이 있는 것이다.

빅 데이터라는 단어가 어떤 경우에 어떤 의미로만 사용되어야 하는가를 따지는 것 그 자체는 크게 실익이 있는 것이 아니라 생각한다. 문제는 실제로 활용 결과의 측면에서 어떤 차이점을 만들어낼 수 있는가 일 것 이다. 빅 데이터라는 이름을 붙이는 덕에 어차피 필요했던 부분에 대해서 좀 더 적극적인 자원투자가 가능하다면 그것도 좋다.

그 이름 덕분에 좀 더 잘 팔리는 상품이 될 수 있다면 역시 나쁠 것 없다. 과거의 비슷한 업무나 제품과 결과 면에서 분명한 차이가 있도록 하느냐가 핵심이다. 좀 더 빠른 속도로 좀 더 많은 분석을, 좀 더 다양한 데이터를 사용해서, 좀 더 적시에 수행할 수 있다면 빅 데이터라는 ‘형용사’를 붙이는 것에 찬성해주고 싶다.

그 분석으로부터 얻을 수 있는 결과가 얼마간이라도 더 나은 것이라면, 꼭 100% 새로운 것이 아니라도 빅 데이터라 부르는 것에 반대하고 싶지 않다. 부르는 사람도 듣는 사람도 어떤 의미에서 ‘빅 데이터’라는 단어를 붙인 것인지 이해한다면 말이다. 그저 빅 데이터를 위한 빅 데이터가 아닌 더 나은 결과를 위한 빅 데이터이기 때문이다.


▲ 전용준 / 리비젼컨설팅 대표, 경영학박사

전용준 / 리비젼컨설팅 대표, 경영학박사
xyxonxyxon@empal.com

저작권자 © 아이티데일리 무단전재 및 재배포 금지