대한민국 빅데이터의 현주소ㆍ방향성 찾는 전문가 5인의 좌담

 
[컴퓨터월드] 요즘 들어 TV 예능 프로그램에서도 ‘빅데이터’라는 단어를 접할 정도로 2014년은 우리 사회가 빅데이터를 향해 보다 가까이 다가섰던 한해로 풀이될 수 있다. 하지만 아직 대한민국 빅데이터의 현주소는 방향성을 계속 찾아가고 있다는 것이 업계의 중론이다.

국내 빅데이터 산업의 발전과, 그리고 그 핵심인 데이터 사이언티스트의 양성에 대한 목소리를 높여온 본지는 빅데이터 전문가 5인을 초청, 2014년을 보내고 2015년을 맞이하는 현시점에서 이 같은 현실을 파악하고, 또 앞으로 나아가야 할 방향에 대해 함께 고민해보는 자리를 마련했다.

대한민국 빅데이터의 성공을 위한 5인 5색의 고견에 귀기울여본다.

 

<참석자>
- 강용성 와이즈넛 대표
- 송길영 다음소프트 부사장
- 유혁 윌로우데이터스트레티지(Willow Data Strategy) 대표
- 이상은 소프트웨어공학센터 소장
- 전용준 리비젼컨설팅 대표 (사회)

 

 

빅데이터, 2014년에 어디까지 왔나

전용준 : 우선 올해 빅데이터의 전반적인 현황에 대한 이야기를 나눠봤으면 한다.

강용성 : 빅데이터기업협의회에서 이야기들을 들어보면 국내도 이전보다는 분위기가 성숙돼, 데이터 기반의 의사결정이라는 관점에서는 수준이 많이 올라왔다. 그러나 산업의 발전으로까지 투자가 뒷받침되진 않아, 애매한 시점이라고 볼 수 있다.

공공부문에서 빅데이터 사업이 많이 진행되고 있는데, 올해 사업들을 살펴보면 명칭만 빅데이터고 내용은 빅데이터가 아닌 게 대부분으로 보인다. 빅데이터를 하겠다고 급하게 진행하다보니 목표점도 없었고, 정부 예산과 민간 투자도 부족했다.

송길영 : 소셜 분석, 고객 이해 등으로 불리던 게 빅데이터까지 이어졌다. 이 빅데이터라는 말 자체가 밀가루와 같다고 본다. 라면도 만들 수 있고 스파게티도 만들 수 있는데, 밀가루가 어떻게 될지 알 수 없는 것 아닌가. ROI(투자수익률)를 내기 위해 투자하는 것은 당연한데, 이를 배제하고 수단인 밀가루를 왜 안하고 있냐는 이야기나 다름없다.

즉, 밀가루로 라면을 만들어 매출을 올리는 부분이 간과되고 있다. 이제 이런 키워드가 있다는 걸 알았으니, 다음 단계로 넘어가야 할 시기다.

이상은 : 공공분야에서 컨설팅을 많이 하고 있는데, 빅데이터라고 포장된 것들이 많다. 실제로 빅데이터로 한 게 별로 없는데, ‘빅데이터화’ 했다고 이야기하는 게 종종 있다. 빅데이터라는 단어가 알려진 뒤부터 이것이 우리 현실과 연결되는지 의문이고, 특히 효용성이나 기술과의 연결이 잘 안 되는 것 같다.

유혁 : 빅데이터는 원래 필요 없는 말이다. 왜냐하면, 컴퓨터가 발명된 이후부터 저장용량이 늘어나지 않고 처리속도가 빨라지지 않은 해가 한 해도 없었기 때문이다. 그렇다면 왜 갑자기 이슈가 됐을까. 툴셋을 판매하는 쪽에서 빅데이터를 정의하고, 이제는 이렇게 엄청난 데이터도 분석, 사용할 수 있다고 말하기 시작했기 때문이다.

반면, 지금까지는 데이터를 의사결정에 활용하지 않았는데, 이제부터 활용하면 곧 빅데이터를 한다고 착각하는 경우도 있다. 전화기에 들어갈 용량의 데이터 갖고도 그것을 이용해 의사결정을 했으니 빅데이터라고 부르는 식이다. 또한 의사결정에 얼마나 많이 쓰일지도 의문이다.

아울러 그 정의가 저장을 얼마나 많이 하고 빨리 꺼내보느냐 등에 초점이 맞춰져 있어 위험해 보인다. 산업에 비교하자면, 각각의 재료와 부품의 공급이 균형 있게 이뤄져야 제품이 나오는 법인데, 공정 초입단계에만 투자가 많이 되는 상황이다. 이러한 불균형이 있다 보니 결과도 좋을 수 없다.

한국에서 미국의 빅데이터 사례를 이야기해주면 그것이 CRM의 연속이라고들 받아들인다. 그리고 사실이 그렇다. 예를 들어 비행기에 1등석이 몇 개 남았다면, 이것을 누구에게 제공해야 더 감동을 줘 그 대상을 단골로 만들지 데이터와 통계적 모델로 결정할 수 있다. 그런데 이런 예를 들면 빅데이터로 천지개벽할 수 있을 것 같은 느낌이 들지 않을 것이다.

그러나 사실 빅데이터는 조금씩 발전해서 큰 성공으로 이어지게 해야 하는 것으로, 소위 대박을 노리고 투자하면 위험하다. 툴셋 구입 등으로 투자했으니 매출이 배로 오를 것을 바라면 낭패를 보기 십상이다. 기업에서 그러한 초기의 시도를 실패로 규정지어 빅데이터에서 손을 떼게 되면 해당 부서가 아예 없어지기도 한다. 첫술에 배부를 수 없는 사업으로, 차츰 성공률을 높이는데 초점을 맞춰야 한다. 게다가 데이터가 확립된 것도, 쌓아놓은 것도 없는데 컨설팅을 해달라는 경우도 있다. 일의 순서도 중요하다.
 

빅데이터와 사람

전용준 : 산업, 혹은 기업내의 분야로 봤을 때 빅데이터의 활용이 활발했던 영역은 어디라고 볼 수 있나.

송길영 : 다음소프트의 슬로건이 ‘Mining Minds’다. 사람들이 남긴 흔적을 보는 일을 한다. 처음에는 고객 지원 분야에서 반응을 분석했었고, 그 다음에 품질관리 분야에서 빠른 리콜이나 피드백을 조사했었으며, 나아가 브랜드에 대한 의식이나 인식을 알아낼 수 있었다. 이후 마케팅 활동에 대한 평가를 할 수 있었고, 여기서 진화해 평가 전 단계에서 계획 수립도 가능해졌다. 여기까지 다 해봤으나 그 ROI가 생각보다 크지 않았다. 이후 상품기획과 마케팅만 남아 있음을 알고 이에 집중해 성과를 내고 고객에게도 좋은 평가를 받고 있다.

이런 과정을 거치면서, 고객이 돈을 벌어야 내가 돈을 번다는 사실을 깨닫게 됐다. 그래서 고객이 돈을 버는 게 무엇인지 살펴보니, 안 팔리는 거 팔리게 하는 것과, 새로운 상품을 선보이는 것이 남았다. 또한, 제품보다 사람을 보는 게 중요하다고 여겨, 사람과 연관되는 업종을 모두 취급하게 됐다.

즉, 애플리케이션과 산업을 반드시 정해야 한다. 빅데이터 사업을 하면서 인프라만을 거론하면 고객사의 최종의사결정권자를 못 만나게 된다.

이상은 : 기업에서 빅데이터로는 ROI가 잘 나오지 않을 것이다. 다만, 공공재 측면에서는 ROI에 상관없이 꾸준히 활용될 것이다. 교통관리 등이 IoT(사물인터넷)로 이어져 수많은 데이터가 파생되는데, 이런 유형은 사회적 편익이고 장기간으로 바라봐야 할 것이다.

유혁 : 닷컴 버블 시기를 돌아보자. 일각에서는 온라인이라는 채널이 늘어났으니 매출이 두 배가 될 것이라고 착각했었으나 실제 세상은 별반 달라지지 않았다. 골프가게에서 골프채와 골프공을 사던 사람이, 골프채는 가게에서 직접 써보고 구입하고, 골프공은 자주 사야 하니 온라인으로 구입하게 됐을 뿐이다. 수요자 관점에서 보면 수요가 늘어나지 않은 것이다.

데이터가 늘어난 것도 마찬가지다. 사업가가 세상을 보는 방법을 바꿨다고 매출이 두 배가 되지 않는다. 다만, 공정을 효율화하는 건 중요한 이슈다. 파이를 더 크게 만들 수는 없다 해도, 비용을 줄일 수는 있는 것이다. 예를 들어 콜센터에서 상담고객이 소위 진상인지 아닌지 미리 알아내 불필요한 소모를 절감할 수 있다. 보이지 않던 부분에서 비용을 절감하는 것이다.

빅데이터에 대해 논의할 때, CEO와 CMO는 잘 이해하는데, CFO가 이해 못하는 경우가 많다. 빅데이터를 했을 때 거기에 관련된 수익증가만을 따로 떼어내 보려고 하며, 투자에 대한 가치를 2년 이내에 거두지 못하면 시도도 하지 말자고 한다. 과도한 투자도 좋지 않지만, 이렇게 데이터 사업을 전체적으로 보지 않는 경우 또한 바람직하지 않다.

기업들은 데이터를 활용했을 때 효율적으로 의사결정을 할 수 있다. 마케팅 경험 측면에서 누구한테 접근해야 할지, 또 접근해서 어떻게 감동을 줘야 할지를 데이터와 분석을 통해 알 수 있다. 미국의 주요 백화점의 경우 매장에서의 데이터 수집률이 90%가 넘는 경우도 많다. 고객에게 선물과 편의 등 다른 가치를 제공하면서 정보를 얻어내고, 이를 바탕으로 마케팅에 활용한다.

그러한 맞춤형 서비스로 고객에게 계속해서 감동을 주면 수익과 시장점유율이 차츰 늘어나기 마련이다. 당장 1~2년 내에는 큰 차이가 벌어지지 않겠지만, 이를 하지 않는 회사는 나중에 도태돼 위기가 닥칠 수 있다.

송길영 : 어느 정도 안정돼있는 회사들에서는 차이가 크지 않은데, 규모가 작은 회사의 경우 이런 사고방법을 도입하는 것만으로 매출이 늘어날 수도 있다. 기업의 비즈니스가 작을수록 이런 부분을 강화하는 것만으로 기회가 생긴다.

빅데이터를 바라보는 관점에 따라 다르지만, 적어도 플레이어는 고객보다 많이 알아야 된다. 그런데 그 안다는 게 인프라에 기술에 대해 아는 게 아니라, 이게 좋아졌을 때 고객의 비즈니스가 어느 부분에서 좋아질 수 있는지 가이드해줄 수 있어야 한다. 이는 컨설팅에 해당하지, 툴이 아니다.

모 고객사와 일할 때 일인데, 고객사 회장에게 데이터를 활용하는 것을 보여주니 관심을 보였고 실제로 이후 적용해 매출도 올랐다. 그런데 알고보니 처음 시작 전 고객사 회장은 자사 전산실을 불러, 외주 주지 말고 직접 해보라고 권유했었다고 한다. 데이터라고 불리니 자신의 회사내 전산시스템 운영부서가 할 수 있지 않을까 생각한 것이었다.

전용준 : 한국과 미국 사례를 주로 이야기했는데, 일본과 중국 쪽은 어떤지도 궁금하다.

강용성 : 일본에서는 와이즈넛이 검색엔진사업을 하고 있는데, 일본의 경우 제조가 강한 나라다보니 빅데이터에 대한 관점이 다르다. 처음에 우리는 소셜 분석 측면으로 주로 언급될 때, 일본은 생산과 유통의 효율성에 집중했다.

이런 차이를 보고 있으면 지식관리시스템이 떠오르는데, KM으로 매니지먼트로 보느냐 KMS로 시스템으로 보느냐하는 혼선 때문에 국내에서는 실패했다. 숙련공들이 노하우를 자발적으로 정제해서 기록을 남겨준 것을 보관·관리·활용하게 되면 공정관리가 효과적으로 이뤄질 것이라는 게 요지였다.

이게 빅데이터로 옮겨온 면이 있는데, 개인적으로는 효과적이라고 생각한다. 사람이 직접 공유해야 하는 상황은 해당 인원의 고용문제와도 직결될 수 있기 때문이다. 자연 발생되는 로그에 가까운 데이터들을 반복적으로 기록 및 조치되고, 이를 IoT에 연결하는 것까지 논의가 되고 있다.

중국에서는 와이즈넛이 가격비교 쇼핑몰 관리를 맡고 있는데, 이곳의 하루 페이지뷰가 6천만이다. 늘 이렇게 큰 데이터를 다뤄왔기에, 빅데이터에 대한 이야기도 하지 않는다. 최근 하루 만에 10조원의 매출을 올린 알리바바의 타오바오는 트래픽이 얼마나 많겠나. 이런 것을 다루는데 능숙하다보니, 관심은 어떻게 돈을 벌 것인지로 흘러가고 있다.

국내는 소셜 분석이 주도해왔던 게 사실이다. 개인정보보호 이슈 때문에 가장 리스크가 적은, 온라인에서 공개된 정보를 활용하게 됐다. 요즘 공공데이터 개방과 맞물려 공공데이터를 활용하라는데, 이런 데이터가 있으니 알아서 모델 발굴하라고 하면 난처하다. 그것도 프로젝트 당 2~3억원, 합쳐서 5~6억원이니 무엇을 어떻게 하라는 것인지 모르겠다.

 

성공적인 빅데이터를 위해

전용준 : 성공적인 빅데이터 활용을 위해서는 앞으로 어떤 것들이 더 필요하다고 보는가.

이상은 : 잘 되는 곳과 안 되는 곳이 차이가 있는 거 같다. 우리 환경은 데이터를 활용해본 적이 별로 없다. SW에는 프로세스로 예를 들면, 계량화하려면 표준화가 돼야 하고, 이를 위해서는 일정한 데이터가 쌓여야 한다. 데이터를 활용하려면 목적이 정해져야 데이터가 유용해지고, 또 시스템도 갖춰져야 한다. 사람을 분석하는 것도 목적이 정해지지 않으면 아무 소용없다.

유혁 : 빅데이터를 성공적으로 하려면 두 가지가 필요하다고 본다. 첫째는 노이즈를 줄여야 한다. 하지만 사람에 따라 좋아하지 않는 음악 장르가 소음으로 들리는 것처럼, 데이터 안의 노이즈도 목적에 따라 따로 정의되고 제거돼야 한다. 그래서 먼저 데이터를 다루는 목적을 분명히 하는 것이 중요하다. 둘째는 데이터를 사람들이 원하는 대답의 형태로 만들어줘야 한다는 것이다. 쉽게 일상적 의사결정에 쓸 수 있도록 직관적인 점수 등의 형태로 사람들이 원하는 답을 작게 만들어주는 것이 중요하다.

만약 신이 와서, 쇼핑몰에서 구입한 과거행적을 모두 알 수 있는 것과, 쇼핑몰에 들어온 사람의 어깨에 카메라를 달아 계속 그 행보를 보게 해주는 것 중에 하나를 고르라고 한다면, 나는 전자를 고를 것이다. 어떤 여성 고객이 신발을 계속 쳐다보는 것은 단지 그게 좋아서일 뿐, 구입 의사가 없을 수도 있다. 과거 기록을 살펴보면 오히려 구입할 사람인지 아닌지를 더 잘 파악할 수 있다.

즉, 작은 데이터가 경우에 따라 예측에 더 정확할 수도 있다는 것이다. 데이터 사용의 목적이 분명하다면 반드시 큰 데이터를 쫓을 필요가 없으며, 만약 두 가지를 모두 쓸 수 있다면 물론 통합해서 쓰는 것이 가장 바람직하다.

미국 유수의 광고회사들은 전쟁을 대비해 탄약고를 채우는 것처럼 지난 10년간 데이터를 많이 가진 회사를 사서 보유해왔다. 데이터 수집의 문제는 많이 해결됐으니 이젠 다른 유형들의 데이터를 어떻게 통합해 사람을 더 정밀하게 묘사하고 변별해 접근하며, 또 어떻게 그들에게 감동을 주는가를 주제로 삼는 단계에 와있다.

송길영 : 비즈니스 로직에 대한 이해가 필요하다. 미국 대선결과를 맞춰서 유명해진 네이트 실버(Nate Silver)의 저서 ‘신호와 소음’에서 나오는 사례인데, 농구경기에 모델링을 활용해 돈을 많이 번 도박사가 야구경기까지 뛰어들었으나 실패했다. 농구는 좋아했는데 야구는 잘 몰랐다는 게 그 이유다.

이처럼 플랫폼이나 데이터를 갖고 결과를 다 맞출 수는 없다. 또 이게 과연 IT 업계만의 일인지, 애플리케이션까지 이해하려면 도메인 날리지까지 해박해야 되는데 과연 모든 도메인 날리지를 익히는 게 가능할지 의문이다.

강용성 : 귀납적·연역적 사고방식이 있지만, 기업들의 의사결정에서 마지막 순간에 중요한 작용을 하는 것은 직관이다. 의사결정에서 직관이 차지하는 비중은 작지 않다.

데이터를 갖고 뭘 한다는 것 자체가 직관의 영역에서 시스템의 영역으로 한 번에 갈 수 있는 게 아니다. 신과 인간의 갭이 있는 영역이 이 파트인데, 이걸 빅데이터와 데이터 사이언티스트가 해결해줄 수 있는 것처럼 거론하는 건 아니라고 본다. 직관은 남겨두고 판단해야 되는데, 시스템적으로 접근하는 경우 마치 이게 다 되는 양 이야기하는 경우가 있다.

유혁 : 수학적 맹점이라고 본다. 통계적 모델을 짜고 분석해 미래를 예측한다는 것은 거의 모든 현상이 과거의 패턴을 밟는다는 가정 아래 성립된다. 데이터와 컴퓨터가 도출해낸 분석의 결과를 보고 답을 얻어내는 통찰력은 아직도 사람의 영역이다. 그런 통찰력을 가진 사람이 질문부터 제대로 해야 하는 것이며, 그 분석의 결과를 의사결정에 얼마나 참고할지도 사람이 결정하는 것이다.

또 의사결정을 하는 사람들 간의 능력차이도 분명이 있다. 그래서 전문가들은 누가 봐도 알 수 있게끔 데이터를 가공해 질문에 대한 답의 형태로 만들어주고, 지속적인 분석활동을 통해 옳은 의사결정의 확률을 높이는 것이 목적이 돼야 한다.

송길영 : 'Best'가 아니다 'Better'다. 한 번에 끝나는 것이 아니니 계속 나아져야 하고, 여기서 기계는 탐색적인 형태의 수고를 덜어준다. 버튼만 눌러 답이 나오는 것을 희망한다면 어떤 것이 'Best'인지 이미 알고 있다는 것인데, 그럴 리가 없잖은가. 문제를 알아야 답을 줄 수 있다.

유혁 : 그 'Best'에 대한 정의도 사업의 목적에 따라 달라진다. 항공사의 예를 들면, 마일리지가 많은 사람, 할인되지 않는 티켓을 많이 산 사람, 퍼스트 클래스만 타는 사람, 쌓인 포인트를 많이 쓰는 사람, 부수적 서비스를 많이 사주는 사람 등 부서마다 가장 선호하는 사람이 다르다. 'Best'에 대한 정의도 사람이 하는 것이다.

 

빅데이터와 사물인터넷(IoT)

전용준 : IoT 등 화두가 되고 있는 영역과 관련한 빅데이터의 흐름과 동향은 어떠하다고 볼 수 있나.

강용성 : 클라우드, 빅데이터, IoT 등을 순차적으로 거론하고 이에 따라 연구비 지원이나 기업들이 내세우는 전공 분야도 유행처럼 계속 바뀌는 현상이 바람직한지 의문이다. 사실 이들은 서로 엮여있는 과제들인데.

IoT는 가능성을 내재하고 있다고 생각한다. 일본의 제조 분야를 보면, 센서 데이터를 수집해 고장을 감지하고 예방한다. 원전사고도 있다 보니 위험한 시설물들 관리도 해야 되고, 자동적으로 사람 손이 덜 가게 관리할 수 있는데 관심을 둔다.

국내에도 발전설비나 자동차 쪽에서 시설물이나 설비에 IoT로 접근하는 시도들이 있다. 기계적인 센서 데이터만 수집해 반복주기만 확인하면 그 이상의 빅데이터는 없을 것이라 예상했는데, 정비에서 새로운 것을 깨달았다. KM하고 섞어서보면 재미있는데, 결국 사람이 조치를 한 것이다.

예를 들어 관리 안 되는 시설물들을 추적해보면, 도면도 갖춰지지 않았는데 부품들을 교체하며 써놓은 일지는 남아있던 경우다. 이것을 분석해보니 센서 데이터를 활용할 필요도 없이 고장주기도 나오고 조치내역까지 압축돼서 나왔다. 올해 경기가 좋았다면 기업들이 이런 것들을 활용하는 준비가 더 빨라지지 않았을까.

이상은 : 제조 분야에서 영업적 기회가 만들어지는 것은 목적하는 바가 다르기 때문이다. 제조의 초점은 생산성이고, 생산성은 대박을 바라는 게 아니라 목표치가 정해져있다. 비용절감이나 생산성 증대기 때문에 기대치가 정해져 있고, 시각도 공통이다. 미국 사람들이 데이터를 많이 쓰는 건 사회 자체가 생산성에 의존하니 그런 면도 있다.

유혁 : 결국 IoT도 사람 중심으로 간다고 본다. 산업공정을 효율적으로 만드는 건 앞으로 물론 쌓여진 데이터를 통해 이뤄져야 할 일이다. 냉장고가 알아서 물건을 주문할 수 있는 시대가 오고 있는데, 그런 시대가 왔다고 사람들이 오렌지 쥬스를 더 많이 사먹게 되는 건 아니다. 소비자들의 구매과정이 더 편해는 것이고, 그 판매과정의 효율성이 높아져 전체적인 사회적 비용이 내려가는 것이다.

시장 크기도 고려의 대상이다. 미국이나 중국 같은 경우 시장이 크니까, 작은 개선도 큰 액수의 비용절감으로 이어진다.

송길영 : 공정 자동화가 무서운 이야기인데, 노조는 직업을 잃는다. 이렇게 되는 게 맞는지도 고민해봐야 한다.

비즈니스를 할 때는 3가지 원칙이 있다. 먼저 유용해야 한다. 다음으로 내가 잘 해야 된다. 마지막으로 남이 못해야 된다. 뭐가 뜬다고 할 때 남이 다 할 수 있으면 가치가 별로 없다. 미국이 빅데이터를 들고 나온 이유는 이 어려운 문제를 풀어보려 하기 때문이다.

 

빅데이터와 공공사업

전용준 : 아무래도 공공 쪽과 관련된 이야기를 하지 않을 수 없을 것 같다. 현재 공공 쪽 빅데이터 관련 예산 규모나 집행에 대해 어떻게 느끼는가.

송길영 : 총액의 문제보다 프로젝트당 예산이 문제다. 이것저것 할 것이 아니라 제대로 된 것 하나에 집중해야 성공사례가 나온다.

또 적은 돈으로 성공한 사례가 나와도 문제다. 돈 얼마 안 드는 줄 오해를 불러일으킬까봐.

강용성 : 시장 측면에서의 접근과 시스템 측면에서의 접근이 선이 분명해야 된다, 오픈소스도 이야기돼야 하는데, 공짜다, 인건비만 든다 등의 논리가 뒤죽박죽 섞여있다.

올해 정부 사업 예산들을 조사해보면, 개별로 쓰인 예산들은 총액이 무색할 수준이다. 빅데이터라는 이름을 붙이기에 정부도 무색해 할 것이다.

유혁 : 진화의 과정을 보면 한국과 미국이 다르다. 미국은 관(官) 지원이랄 게 없고 정글이라고 보는 게 맞다. 수천 명이 비슷한 아이디어를 갖고 시작해 몇 명이 대박나고 나머지는 다 망하는 구조다. 월스트리트의 VC(벤쳐 캐피탈리스트)들의 접근방법은 200개 이상의 스타트업에 투자해 그 중 하나만 대박나도 본전을 뽑고도 남는다는 것이며, 구글의 마인드도 여러 아이디어를 동시에 지원해 살아남는 것에 중점을 둔다는 식이다.

이상은 : 공공사업이란 게 결국은 시범사업의 성격을 갖듯, 빅데이터도 마찬가지다. 한 번에 큰돈을 들여서 성공할 프로젝트만 하면 중소기업에게는 기회가 없다. 적당한 사이즈로 나가서 중소기업에게 기회를 주는 것은 적절하다고 본다.

미국은 민간에서 투자해서 새로운 것을 발견하고 있지만, 우리는 벤처 생태계가 잘 갖춰지지 않은 상태라, 기술적으로 시장이 개화할 것이란 예상에서 적당한 예산으로 정부가 디딤돌을 놔주는 건 적절하다고 본다.

강용성 : 세금이 들어가니 한쪽으로 쏠리거나 하지 않고 중소기업에 기회를 많이 주는 건 좋은데, 하향평준화가 아닐까 우려된다. 정치적 액션으로 예산이 활용돼 세밀하게 쪼개지다 보면, 사업 600여개에 2~3억씩 나눠가져야 하는 상황이 된다.

송길영 : 관점의 차이가 있을 수 있다. 프로젝트를 하는 건 우리의 경우 고객사가 돈을 버는 것을 돕기 위해서다. 정부가 이런 일 하는 이유가 빅데이터를 하고자 하는 회사들에게 시드 펀딩을 해줘서 기술을 개발한 다음에 이를 민간에 퍼뜨리자는 것이라면 하는 게 맞다.

그러나 정부가 생산성을 올리기 위해 데이터를 기반으로 행정의 효율화하는 것이 목적이라면, 현재의 접근은 위험하다. 노선을 결정해야 된다.

강용성 : 미래부의 경우 대부분 진흥이 목적이고, 안행부의 경우 행정업무시스템 개선과 공공데이터 개방 등을 수행한다. 업체는 방향을 어디에 맞춰야 할지 헷갈린다. 미래부가 예산을 쪼개서 진행하는 게 다른 쪽 예산의 적정선까지도 영향을 줄 수 있다. 미래부는 산업에 맞도록 기준을 잡고 예산이 쓰이는 성격 자체도 명확하게 짚고 갔어야 했다.

또 문제가 정보화진흥원(NIA)이 이런 사업에 상당수 관여돼있는데, 미래부 소속도 안행부도 소속도 아니란 점이다. 정책적으로 확실하게 나뉘면 덜할 텐데, 담당자들과 업체들은 매번 혼선을 빚는다.

유혁 : 아이디어 싸움이지 돈 싸움은 아니라고 본다. 아이디어가 별로 좋지 않으면 그 사업에 돈을 퍼붓게 되는 거다. 개인적으로 어떻게 하면 좋은 데이터 사이언티스트가 되냐고 묻는 질문에 배낭여행을 많이 해보고 다양한 소비자가 돼보며 인문서적도 많이 보라고 답한다. 창의적인 아이디어는 사용자 입장에서 나오고, 오픈소스를 통해 개발이 빨라진 점은 많은 아이디어를 실현 가능케 했다.

문화적 차이도 있다. 미국은 수많은 스타트업 회사들 중에 몇몇만 살아남는 구조고, 한국은 키우는 구조다. 무엇이 옳고 그른 게 아니라 그저 다른 것인데, 그 바탕에 아이디어가 좋아야 한다는 점은 공통적으로 적용된다.

이상은 : 서구는 19세기부터 지금까지 기술과학에서 발달해온 나라고, 원천기술과 응용기술을 국가와 민간에서 다 보유하고 있다. 이제는 혁신이 기술과학의 혁신이 아니고 사회에 대한 혁신이 이뤄지고 있다. 이러다보니 21세기 들어 가치를 따진다. 기술이 충분히 성숙했기 때문이다.

국내는 상황이 다르다. 핵심적인 것들을 외국의 기술로 만들고, 우리는 껍데기를 만든다. 알맹이를 취하려면 기술이 우리 것이어야 한다.

유혁 : 관점이 조금 다른데, 데이터 관련 산업을 이끄는 것은 영화감독의 자리와 비슷하다고 본다. 소프트웨어, 통계적 분석, 플랫폼 등에 각각의 역할을 부여해 그것들을 통합해서 가치를 창출하는 것으로, 성공은 결국 아이디어에 달렸다. 무엇을 어떻게 만들어야겠다고 목적이 분명히 정해졌을 때 기술이 필요한 것이다.

한국영화가 외국에서 유행하고 있는 이유는 내용이 좋아서다. 관객들은 감독이 어떤 카메라 제품을 썼고 특수효과는 누가 제작했나에는 별로 관심 없다. 기술적인 분야의 투자도 필요하지만, 기술적으로 할 수 있다고 해서 꼭 해야 되는 건 아니다.

이상은 : 반대로 보자면, 과거에 축적된 경험이 없는 사람이 향후 창조적인 아이디어를 구하기는 어렵다. 일을 해보고 고민해봐야 어떻게 해야 될지 생각이 들기 마련이다.

전용준 : 2003년 아마존 사람들 만났을 때, IT회사이기 때문에 마케터도 MD도 필요 없이 모든 걸 자동화한다는 이야기를 들었다. 당시에도 창사 이래 데이터를 버린 적이 없다고 했다. 캠페인 분석조차도 캠페인 계획과 성과 평가를 자동화하는 SW를 자체 개발하는 등 다양한 것을 만들고 있었다.

이런 단계에서는 가치를 논할 수 있는데, 아직 여기까지 가지 못했다면 정부에서 자금이나 인력이나 공용 SW 등을 지원해 우리나라 사람도 비슷하게 경쟁할 수 있게 해주는 게 좋지 않을까.

이상은 : 비즈니스 가치란 게 아이디어만이 아니라, 리소스나 기술에서 나올 수도 있다. 공개SW가 성공할 수 있었던 것은 기술 제공 속도가 빠르고 비용이 저렴했기 때문이다.

유혁 : 앞으로는 SW보다는 정보를 잘 흐르게 하는 사람이 돈을 더 많이 벌 것이다. 흐름에 막힘이 없어야 하고, 데이터가 한 단계를 지날 때마다 더 좋아져야 한다. 미국도 이런 생태계가 불합리하고 미숙한 점이 많다. 데이터도 통합과 유통으로 가게 돼있다.

 

빅데이터, 2015년에는 어디로 가야 하나

전용준 : 내년도 전망에 대한 이야기를 나눠보자.

유혁 : 유통과 흐름을 제대로 타는 사람이 이긴다. 그리고 데이터의 수집이 수월해지면서 고립된 데이터베이스가 굉장히 많아졌다. 그 사이의 연결고리를 찾는 과정이 필요하다. 거기에서 국내에서는 규제가, 미국의 경우에는 데이터 소유권이 걸림돌이 될 수 있다. 하지만 데이터란 통합이 될수록 더 강력해지는 법이다.

많은 나라에서 개인정보에 대한 논의도 많아졌는데, 데이터가 잘못될 경우 범죄적인 면을 따로 떼어 보는 것이 중요하다. 교통사고가 많이 난다고 길을 아예 폐쇄해버리는 식의 우를 범해서는 곤란하다. 무조건 데이터의 소통을 막아버릴 일이 아니라, 큰 사고만 안 나게 두고 보자는 식으로 데이터의 유통을 보는 관점만 바꿔도 물꼬가 터질 것이라 본다. 꼭 외국의 사례가 옳다는 것은 아니지만, 미국에서는 실제로 그렇게 해 아주 커다란 데이터 산업 자체가 이뤄졌다.

송길영 : 엔드유저가 가치를 얻어야 한다. 그래야 엔드유저에게 도움을 줬던 이들이 그 가치의 일부를 가져갈 수 있다. 엔드유저가 누구이고 가치가 무엇인지 정의할 필요가 있다. 또 엔드유저는 고객에게 가치를 얻고 있는 것이므로, 결국에는 사람이 고객이다.

고로, 사람에 대한 이해를 데이터의 기반으로 할 것이고, 이는 선순환의 고리를 지니고 있다고 생각한다. 이에 대한 보다 근본적인 생각이 필요하다.

강용성 : 업계는 성장동력이 필요하고, 빅데이터가 마켓에 뭔가 할 수 있는 계기를 준다는 점에서 긍정적인 면이 있다. 지난 3~4년간 정부의 예산 방향이나 기업의 투자에 대한 확신 등의 콘셉트를 잡는데 너무 많은 시간을 소비했다. 이제 사업을 실제로 하면서 개선을 시도하다보니 빅데이터에 대한 인식이 높아졌고, 고객 쪽에서도 고민의 수준이 올라가기 시작했다. 정부도 공공부문 빅데이터 사업의 해결책을 찾으려 노력하고 있는 것 같다.

문제의식들이 생겼기 때문에 빅데이터가 이젠 패셔너블한 아이템으로 자리할 것이라 보진 않고, 제조 분야에서 대박이 아니라 꾸준한 효율과 개선이라는 측면에서 사례가 발굴되면서 산업으로서 성숙돼가는 2015년이 되지 않을까.

이상은 : 빅데이터를 유행어처럼 받아들이다가 실체를 파악하니 두 가지 측면에서 노력이 필요해 보인다. 수요자 입장에서 어떤 목적으로 쓸 것인지에 대한 계몽이 필요하고, 다음으로 IT기업들에게 툴을 만들 수 있는 기회가 제공된다. SW가 다 그렇듯이, 한번 만들어서 좋은 제품이 나올 수 없다. 계속 해봐야 품질이 좋아지고 경쟁력이 생기니, 그런 기회를 공공SW부터 만들어가는 게 중요하다.

또 재원이 나올 수 없을 만큼의 투자가 다수에게 조금씩 돌아가는 것보다 경쟁력 있는 곳에 충분히 투자할 수 있도록 조율이 필요해 보인다.

전용준 : 대한민국에서 빅데이터 덕분에 먹고사는 사람들이 많아지기를 바란다. 또 대부분의 전문가들조차 빅데이터와 데이터 사이언티스트에 대한 정의와 의의에 대해 여전히 고민하고 있는데, 언론에서는 이를 너무 가볍게 거론하는 측면이 있다. 데이터 산업에 대한 잘못된 정보가 전달되지 않도록, 언론의 책임도 중요할 것 같다.

관련기사

저작권자 © 아이티데일리 무단전재 및 재배포 금지