11.20
뉴스홈 > 칼럼
[특별연재(12)] 데이터를 잘 써먹을 수 있는 구체적인 방법들훌륭한 데이터 사이언티스트란? (유혁 Willow Data Strategy 대표)

   
▲ 유혁 Willow Data Strategy 대표

[컴퓨터월드] 유혁 대표(미국명 Stephen H. Yu)는 25년 이상 데이터베이스 마케팅 분야에서 명성을 얻고 있는 세계적인 데이터 전략, 빅데이터 애널리틱스 전문가이다. I-Behavior의 공동창업자/CTO, Infogroup 부사장 등을 역임하면서 정보수집, 데이터베이스 설계, 통계학적 모델을 활용한 타깃마케팅 등 마케팅과 IT간의 가교에 큰 기여를 해왔다.
유혁 대표의 오랜 전문가로서의 경험을 바탕으로 국내 사용자들과 독자들에게 보다 데이터를 효과적으로 잘 사용하면서 시행착오를 줄일 수 있는 방법을 특별연재를 통해 소개하고자 한다. 금융, 통신, 미디어, 유통, NGO 등 다양한 글로벌 고객들과의 현장 경험에서 우러나온 애정 어린 충고와 쓴 소리에 독자들의 많은 관심을 부탁드린다.
  편집자 주

 

'빅데이터'와 더불어 '데이터 사이언티스트(Data Scientist)'란 타이틀도 대유행이다. 이젠 아무도 단순히 '분석가(Analyst)'로 불리고 싶지 않은 듯하다. 하긴 미국에서도 직책의 인플레이션은 오래 지속돼온 현상인데, 'Secretary'를 'Administrative Assistant'라고 불러줘야 하는 것은 많은 사업장에서 이미 굳어진 관행이고, 비행기를 타고서 제대로 서비스를 받고 싶으면 'Stewardess'란 고전적인 명칭 대신에 'Flight Attendant'란 새로운 직함을 사용해야 할 것이다.

물론 이것은 미국에서의 경우이고, 미국 여객기보다 서비스가 비교도 할 수 없이 우수한 한국 국적기 안에서, 그것도 고공비행 중에 라면을 제대로 끓여오지 않았다고 승무원의 따귀를 칠 수 있는 강심장에게는 애초에 해당 사항 없는 얘기다.

유사한 예로 건물관리를 하는 'Janitor'란 직업의 명칭은 'Custodial Engineer', 'Sanitary Engineer', 'Maintenance Technician' 등 듣기에 그럴듯한 타이틀로 바뀌었는데, 얼핏 보면 그 건물관리인이란 직업이 무슨 공학을 전공한 사람만이 할 수 있는 일이란 착각을 하게 만든다.

하긴 미국에서의 인플레이션에 맞춰 조정된 수입(Income) 지수는 계속 하강추세라니 고용자의 입장에서야 돈이 더 드는 것도 아니고 직원들 직함이라도 더 근사하게 붙여주는 게 추세인가보다.


'데이터 사이언티스트'에 너무 많은 자격을 요구

그런 식으로 언제부터인가 데이터를 만지는 것을 직업을 삼는 사람들은 죄다 데이터 사이언티스트로 불리기 시작했다. 타이틀이 바뀌었다고 본질이 바뀌는 것도 아니고, 그와 더불어 갑자기 보수가 다 같이 올라간 것 같이 보이지도 않지만, 한 가지 분명한 것은 위의 예와 달리 데이터 사이언티스트의 경우에는 그 자격요건도 굉장히 까다로워진 것 같다는 점이다.

미국에서의 경우지만 심지어는 다음과 같은 조건을 동시에 다 요구하는 구인광고도 흔히 본다.

• "A master's degree in statistics or mathematics; able to build statistical models proficiently using R or SAS“
 - 통계나 수학전공 석사 이상의 학력을 가지고 R이나 SAS를 이용해 직접 통계적 모델을 개발할 수 있는 지식과 능력
• "Strong analytical and story-telling skills“
 - 뛰어난 분석과 스토리텔링 능력
• "Hands-on knowledge in technologies such as Hadoop, Java, Python, C++, NoSQL, etc., being able to manipulate the data any which way independently“
 - 여기 열거된 기술들을 이용해 어떤 방향으로든 데이터를 가공할 수 있는 실전 지식
• "Deep knowledge in ETL (extract, transform and load) to handle data from all sources“
 - 각종 ETL 툴셋을 이용해 출처를 막론한 데이터를 다룰 수 있는 능력
• "Proven experience in data modeling and database design“
 - 데이터 모델링과 데이터베이스 구축에 관한 실제적 경험
• "Data visualization skills using whatever the tools that are considered to be cool this month“
 - 이번 달에 '쿨'하다고 여겨지고 있는 툴셋을 이용해 데이터의 시각화를 구현할 수 있는 기술
• "Deep business/industry/domain knowledge“
 - 비즈니스와 산업에 관한 깊은 지식
• "Superb written and verbal communication skills, being able to explain complex technical concepts in plain English“
 - 복잡한 기술적인 콘셉트를 일반 언어를 사용해 설명할 수 있는 출중한 쓰기와 말하기 능력
• Etc. etc…
 - 기타 등등

이 리스트는 이미 충분히 황당하기 때문에 기억나는 대로만 대충 쓴 것이다. 이런 슈퍼 파워를 지닌 사람을 현실 사회에서 과거의 고참 통계 전문가(Sr. Statistical Analyst도 결코 저급한 타이틀이 아니다) 정도의 임금 수준에서 찾아야 하는 리크루팅 담당자의 얼굴을 보고 싶을 지경이다. 내친김에 얼굴도 영화배우같이 잘생기고 춤도 아이돌 같이 잘 춰야한다는 조건을 더하면 어떨까?

이런 일이 생기는 이유는 어디서 데이터가 중요하다는 말을 들은 중역이나 담당자가 단 한 명의 직원을 채용해 모든 데이터 관련 일을 한꺼번에 해결하려고 들기 때문이다. 그 한 명의 슈퍼맨이 구분되지도 않고 정리되지도 않은 산더미 같은 데이터를 들여다보고 제대로 질문이 이뤄지지도 않은 상황에서 온갖 해결책을 알아서 내놓기를 바란다는 것인데, 그런 경우 해줄 말은 "커피 - 냉수는 시대에 뒤떨어진 것처럼 들릴 수도 있으니 - 한 잔 마시고 꿈 깨세요" 밖에 없다.

필자는 오랫동안 통계전문가, 분석가, 그리고 프로그래머들과 함께 큰 데이터, 작은 데이터, 때로는 정리가 잘돼있는 데이터, 하지만 대부분의 경우 더러운 데이터, 때로는 아주 심하게 더러운 데이터를 다루며 거기에서 의미를 끄집어내 사업에 도움이 되는 정보를 제공하는 일을 해왔다. 그리고 그런 과정은 예외 없이 팀워크로 이뤄져온 것이다.


한 사람이 데이터 관련 일 다 맡으라는 건 터무니없는 요구

세상에는 작사, 작곡, 노래, 모든 악기연주, 필요한 프로그래밍과 시퀀싱, 녹음, 믹싱, 편집, 제작, 그리고 음악의 판매까지 혼자 다 할 수 있는 뮤지션도 없지는 않다. 하지만 꼭 그런 천재적인 사람만 음악을 제작할 수 있다면 세상에 들을 음악은 별로 없을 것이다.

어려서부터 천재 음악가로 세계적으로 유명한 스티비 원더는 작사, 작곡, 노래를 다 잘하고 키보드, 피아노, 드럼, 하모니카를 정말 잘 다루지만, 그의 전성기 때 만든 앨범을 보면 백 명에 가까운 다른 음악인들과 녹음 전문가들이 작업에 참여한 것을 볼 수 있다. 디지털 혁명으로 음악 산업도 데이터 산업만큼이나 많은 변화를 거쳐 지금은 그렇게 많은 사람들을 필요로 하지 않지만, 그 두 가지 사업 모두가 결코 원맨쇼가 아니며 그렇게 될 수도 없다.

만약에 그 데이터 사이언티스트라는 직업이 프로그램을 짜서 잘 정렬된 데이터베이스를 구축하고, 통계적 모델도 프로급으로 만들고, 분석의 결과를 검토해 아무나 다 쉽게 알아볼 수 있는 보고서를 만들어 세일즈맨급 프레젠테이션도 하고, 거기서 파생된 새로운 아이디어를 비즈니스에 적용시킬 수 있는 아이디어도 내놓는 그야말로 초능력을 지닌 사업가/분석가/프로그래머/통계전문가를 일컫는 것이라면, 주어진 예산 안에서 그런 사람을 단 한 명이라도 찾을 수 있으리라는 희망은 일찌감치 버리는 것이 좋다.

미국처럼 시장이 크고 데이터 산업이 다년간 발전해온 나라에서도 그런 자격조건(소위 말하는 '스펙'은 사람을 두고 쓰는 단어가 아니다)을 다 갖춘 사람들은 손에 꼽을 정도밖에 없을 것이며, 그 중 대부분은 이미 어디에선가 아주 좋은 조건을 갖고 활동하고 있을 터라 그들의 이름이 Job Market에 나와 있지도 않을 것이다. 현실이 그러한데 각종 산업 보고서들은 데이터 사이언티스트가 당장 수만 명이 필요하다고 떠들어대고 있다.

하지만 그 타이틀이 단지 통계적 소양과 비즈니스에 대한 이해가 깊은 데이터 분석가(Data Analyst)의 변형이라면 그건 고려해볼만 한 것이고, 실제로 필자는 그런 사람들을 많이 알고 있으며 트레이닝을 통해 더 많은 분석가들을 훈련시켜 배출해낼 수도 있을 것이다. 그런 경우라면 타이틀이 길건 짧건 요즘 유행하는 것 아무거나 하나 골라잡으라고 하고 적절한 후보자가 필요한 소양을 갖추게 하면 될 일이다.


고등 분석 관련 데이터 프로젝트에도 업무 분산 필요

필자는 이 데이터 산업에 오랫동안 몸담고 있었으며, 데이터가 이렇게 엄청나게 커지기 이전에도 고등 분석이 필요한 데이터 프로젝트를 수행할 때 다음과 같이 업무를 분산해왔다.

• Business Analysts (비즈니스 분석가)
• Programmers/Developers (프로그래머/개발자)
• Statistical Analysts (통계 전문가)

그 이유는 아주 간단하다. 이 세 가지 영역 중 단 한 분야에서만이라도 마스터급의 특출한 전문가가 되기란 결코 쉬운 일이 아니기 때문이다. 과거에 정말 수백 명이 넘는 통계 전문가들과 같이 일을 해봤지만, 그 중 통계나 수학 이외에 비즈니스 쪽에 관심이라도 가져본 사람들은 손에 꼽을 정도밖에 안 된다.

그 중에서도 성공적으로 비즈니스맨으로 탈바꿈에 성공한 사람들은 또 소수에 불과하며, 그들의 대부분은 지금 자신의 컨설팅 비즈니스를 수행하고 있거나 큰 회사에서 'Chief'로 시작하는 - 요즘 유행하는 'Chief Data Officer'나 'Chief Analytics Officer' 등 - 직함을 가지고 활동하고 있다.

그 반대편의 능력을 보자면 통계 전문가들 중 대략 10분의 1 정도가 복잡한 데이터를 자유자재로 다룰 수 있는데, 사실 그들 대부분도 프로그래머나 개발자들로부터 완전히 독립할 수 있는 수준은 되지 못한다. 현실은 대부분의 통계 전문가들이 정리되지 않고 아주 지저분한 데이터베이스에서 제대로 된 샘플을 만들어내는 능력을 갖고 있지 않다는 것이다.

간단히 말해 통계적 작업과 데이터베이스 작업은 아주 다른 소양을 필요로 하며, 그 두 가지를 다 프로급으로 잘하는 사람들은 정말 드물다. 비즈니스 분석가, 즉 우리가 Business Analyst나 Research Analyst로 부르던 사람들이 요즘 말하는 데이터 사이언티스트에 가장 근접한 것처럼 보이는데, 차이가 있다면 툴셋 등의 미비로 과거의 분석가들이 비교적 덜 테크니컬한 면도 있었다는 점이다.

그런데 경험에 의하면 통계나 프로그램 등 기술적인 지식을 갖고 있는 사람들에게 비즈니스 지식과 소양을 가르치는 것이 마케터나 기술을 전혀 모르던 사람들에게 컴퓨터 프로그램이나 통계를 가르치는 것보다 훨씬 더 수월하다는 것이다. 그래서 많은 비즈니스 세계와 기술적 세계 사이의 '중간인'들은 필자를 포함해서 기술적인 배경을 갖고 있거나 그렇지 않더라도 최소한 기술적 지식을 두루 갖추고 있는 경우가 대부분이다.


비즈니스적 요건이 IT적 자질만큼이나 중요

이러한 Business Analyst나 Research Analyst들이 하는 일들을 간추려보자면,

• 당면한 비즈니스 이슈와 과제를 제대로 이해하고 정리해
• 거기에 대한 해결책(Solution)들을 제시하며
• 그 해결을 위한 가시적 분석 프로젝트를 기획하고
• 분석을 위해 필요한 접근 가능한 데이터를 수집, 검토하며
• 경우에 따라 여러 출처에 흩어져있는 데이터를 통합하는 구체적 계획을 세우고
• 비즈니스의 목적을 데이터베이스 구축이나 통계적 모델 등을 위한 기술적 스펙으로 번역하며
• 특히 타깃의 정의를 주어진 데이터의 범위 안에서 논리적 언어로 표현하고
• 관련된 모든 프로젝트의 진전을 총괄 책임지는 Project Manager의 역할도 하며
• 분석의 결과를 리포트로 작성하며 또한 인포그래픽을 통한 시각화(Visualization)를 구현하고
• 그러한 분석 리포트를 알아듣기 쉬운 언어를 사용해 '스토리'로 바꾸어 비전문가들에게 설명하며
• 중역용으로 간추린 결과(Executive Summary)와 함께 의사결정자들이 취해야 할 다음 스텝들을 제시한다.

이 리스트가 복잡하게 보인다면 그것은 그 임무가 정말로 복잡하고 어려워서이며, 여기에 모든 자세한 부분들까지 열거한 것도 아니다. 이런 일을 제대로 수행하려면 관련된 데이터베이스, 통계와 일반 분석 등 모든 기술적인 요소들의 효용성과 한계를 잘 알고 있어야 하며, 비즈니스에 관련된 산업지식, 사업모델, 사용하는 마케팅 채널들의 특성까지 제대로 꿰고 있어야 한다.

하지만 그렇다고 해서 이러한 분석가들이나 데이터 사이언티스트라고 불리는 사람들이 통계 전문가나 프로급 코딩 전문가가 될 필요까지는 없다. 중요한 자질은 처리해야 될 일들이 어떤 것인지를 정확하게 파악하고, 자신의 의사를 기술 전문가들과 기술적인 요소들과는 무관한 의사결정자들에게 논리적으로 분명하게 전달할 수 있는 능력이다. 이 모든 지식과 더불어 코딩까지 할 수 있다면 그야말로 금상첨화겠지만, 요점은 비즈니스적 요건이 IT적 자질만큼이나 중요하다는 것이다.

이렇듯 이 세 가지 분야에서 두 가지를 잘하기도 어려운 것인데, 인류 역사상 가장 많고 복잡한 데이터가 떠돌아다니는 시절에 데이터와 분석에 관한 모든 전문지식을 두루 다 갖춘 사람을 고집한다는 것은 어리석은 일이다. 많은 툴 셋의 발전이 분석가들의 삶을 쉽고 간단하게 만든 것은 사실이지만, 분야 간의 장벽을 완전히 허물 정도는 아니다. 야구에서 어떤 3루수는 피칭도 웬만큼 할 수 있을지 모르지만, 그렇다고 프로 수준의 경기에서 그가 선발로 나서겠다고 하는 것은 객기다.

분석가들도 회사나 조직에서 승진가도를 달리는 사람들은 분야별 장벽을 넘나드는 경력을 가진 사람들이 대부분이지만, 그렇다고 비즈니스 하는 사람들이 모든 조건을 한 몸에 다 갖춘 팔방미인만을 고집하며 그런 사람을 구세주처럼 기다리고 있으란 얘긴 아니다. 이미 말했듯이 스티비 원더도 사운드 엔지니어를 필요로 하는 법이다.


네 가지 평가 기준들

그렇다면 기존의 탤런트 풀에서 어떻게 하면 데이터 사이언티스트를 찾아낼 수 있을 것인가? 필자는 IT 관련 분야에 종사하는 사람들 중 조직내외로 상승요건을 갖춘 후보자들을 찾기 위해 다음 네 가지의 평가 기준들을 오랫동안 성공적으로 사용해왔다.

이미 언급했듯이 기술적 배경을 가진 사람들에게 비즈니스를 가르치는 것이 그 반대의 경우보다 훨씬 수월하고 성공률도 높기 때문에 우리가 소위 말하는 'Techie'들로부터 탐색을 시작하는 것이 바람직하며, 후보자가 다음과 같은 요소들을 다 갖췄는지를 살피는 것이 중요하다.

1) 기술적 능력

기술을 가진 사람들을 평가할 때에는 이것이 가장 중요한 요소임은 두말할 나위 없다. 그리고 기술적이고 논리적인 소양은 타고나는 것이지 가르쳐서 되지 않는 부분이 있다. 만약에 개발자라면 그가 얼마나 그 일을 잘하는가, 시간낭비는 하지 않는가 등을 살펴봐야 한다.

코딩을 잘하는 사람들은 웬만한 경쟁자들보다 약간만 더 빠른 것이 아니라 열 배, 스무 배 빠른 경우도 흔하다. 매뉴얼을 매번 살펴보지 않고도 웬만한 옵션의 장, 단점들을 다 고려하며 머리 속에 이미 프로그램이 다 짜여 있는 사람들이 그렇다. 통계 전문가들도 마찬가지다.

여러 가지 통계적 모델을 만드는 방법들을 다 알고 있는가 아니면 매번 같은 방법만을 고집하는가, 과거의 기록은 어떤가, 그가 짠 모델들이 오랫동안 예측력을 지속하고 있는가 등을 살펴봐야 한다. 통계적 모델의 궁극적 테스트는 바로 시간인 것이, 미래예측을 위한 모델은 시간이 지나면서 그 결과가 가시적으로 나타나게 마련이기 때문이다.

2) 태도

이것은 아주 중요한 요소인데, 그것은 많은 기술 전문가들이 그 자신들만의 세계에 갇혀있는 경우가 많기 때문이다. 사회성이 떨어지는 경우도 많고, 대부분의 Techie들은 사람들을 상대하기보다 기계를 상대하는 것을 선호한다. 다른 팀 멤버들과 잘 어울리지 못하고 타협을 하지 못하는 수도 많은데, 그것은 대개 입장을 바꿔볼 줄을 몰라서 그런 것이다.

천성적으로 게으른 개발자들도 많은데, 게으른 프로그래머가 자신들이 일단 편해지려고 자동화를 더 많이 한다는 우스갯소리도 있지만, 여하튼 프로젝트 만기일을 자주 놓치는 기술자는 팀에서 환영받을 수가 없다. 간단히 말해 태도가 나쁜 천재는 그의 IQ점수와 상관없이 비즈니스 사회나 관리직으로 넘어가 살아남기가 어렵다.

3) 커뮤니케이션

기술 전문가들은 쓰기와 말하기를 통한 커뮤니케이션에 능하지 않은 경우가 많다. 미국에서 이런 말을 하면 외국 출신들을 말하는 것이냐는 지적을 받을 수 있지만(사실 미국에서 많은 기술적인 분야는 인도나 중국 등 외국 출신들이 주를 이룬다), 미국에서 태어나서 자란 사람들 중에도 '영어로' 남과 제대로 소통을 하지 못하는 경우가 허다하다.

자기네들끼리만 통하는 기술적인 용어를 쓰지 않고는 콘셉트를 설명하지 못하며, 의사결정자들을 위해 요점만 추려서 말하는 것도 어려워한다. 결론만 말하면 될 것을 그 결과를 내놓기 위해 얼마나 많은 기술적 역경을 거쳐왔는지 장황하게 늘어놓는 것은 회의 중 남들을 잠들게 만드는 첩경이다.

거꾸로 많은 통계나 데이터 전문가들은 마케팅 하는 사람들이 당최 무슨 말을 하는지 못 알아듣는 경우가 많다. 일부는 모든 사람들이 논리적으로 완벽한 문장만을 구사하기를 바라는데, 불행히도 많은 마케팅 전문가들이나 창의적인 사람들은 논리적 사고방식을 갖추고 있지 않다. 그래서 그 두 세계의 중간에 서서 통역을 할 수 있는 분석전문가가 필요한 것인데, 말할 나위 없이 그런 통역가는 두 가지 언어를 다 잘 이해하고 다룰 수 있어야 하는 법이다.

4) 비즈니스의 이해

만약에 어떤 후보자가 1에서 3까지의 자질을 두루 다 갖췄다면, 비즈니스의 목적과 생태를 이해하고자 하는 열정적 태도가 데이터 사이언티스트로 가는 여정에서 그 자신이 남에 비해 뛰어나게 보이게 하는 요소가 된다. 이미 언급했듯이 많은 기술적인 직종에 있는 사람들은 그들의 기술적 지식과 능력에 상관없이 비즈니스 쪽에 관심이나 호기심이 별로 없다.

그들이 일하고 있는 회사의 사업 모델이 무엇인가, 도대체 어디서 어떻게 돈이 들어오는가, 중요한 비즈니스 이슈들은 무엇인가, 고객들의 장단기 사업 목적은 또 무엇인가, 무엇 때문에 그들이 밤새 고민하는가, 불완전한 데이터에 대해 불평을 늘어놓기 전에 왜 그 데이터베이스가 그렇게 됐다고 생각하는가, 데이터는 대체 어떤 경로로 여기까지 온 것인가, 그런 데이터가 사업수익과 어떤 관련이 있는가, 대단한 기술적 과학적 발견을 했더라도 거기에 대해 비즈니스적 관점으로부터 'So what?'이란 질문을 할 수 있는가, 그리고 궁극적으로 어떻게 하면 이 데이터 관련 일을 맡긴 사람이 '그의 보스' 앞에서 잘 보이게 할 수 있겠는가 등에 대한 이해가 있어야 한다.

기술적인 이슈들을 다루다보면 갈림길에 서있게 되는 경우가 많은데, 집단 전체를 위해 가장 바람직한 선택은 단지 기술적인 지식만으로 할 수 있는 것이 아니다. 세상을 전체적으로 볼 수 있는 사람이 일부 프로그램을 위한 작은 선택이라도 더 바람직한 방향으로 할 수 있으며, 그런 작은 요소들이 모여서 큰 성공을 이루는 법이다. 불행히도 그런 균형 잡힌 시각을 갖춘 사람을 찾기란 쉬운 일이 아니다.


'균형 잡힌 시각'이 핵심요소

여기서 그 '균형 잡힌 시각'이 바로 핵심요소이다. 데이터 사이언티스트는 비즈니스와 기술적인 소양을 두루 갖추고 있는 사람이지, 모든 IT와 분석작업을 혼자서 다 할 수 있는 것만이 충분조건은 아니다. 마치 사업전략을 데이터 전략가(Data Strategist)가 독단적으로 짤 수 있는 것이 아니듯이, 데이터 프로젝트도 한 사람의 Super-Techie가 할 수 있는 일이 아니다.

우리가 필요로 하는 데이터 사이언티스트나 분석가는 비즈니스의 당면과제와 궁극적인 목적을 제대로 이해하고, 당면 과제들을 해결하기 위해 사용할 모든 기술과 데이터의 한계 내에서 프로젝트 스펙을 만들어 일을 추진하며, 또 그 결과를 일반적인 언어로 소통할 수 있는 사람이다. 그리고 그런 자질은 단지 혼자서 모든 기술적인 일을 다 할 수 있는 것과는 크게 다르다.

그 데이터 사이언티스트의 커리어가 궁극적으로 Chief Data Officer나 Chief Analytics Officer 등으로 가고 있는 것이라면, 후보자들은 그 Chief라는 말이 들어가 있는 타이틀이 비즈니스에 관한 것이지 IT분야에서 갈 데까지 간 직함이 아니란 것을 깨달아야 한다.

그 직책이 CTO건 CDO건 CAO이건, 그들이 비즈니스보다 IT적 관점을 우선해 의사결정을 반복하게 되면 그 조직 자체에 커다란 문제가 생긴다. 그들은 기술적 분야를 잘 이해하며 회사나 조직전체의 수익과 효율을 위한 결정과 판단을 하는 중역들이어야 한다.

영화감독들은 대부분 그들이 직접 각본을 쓰지 않고, 카메라도 잡지 않으며, 특수효과도 만들지 않고, 연기를 직접 나서서 하지도 않는다. 하지만 그들은 영화를 만드는 과정의 모든 요소들을 잘 이해하여 사용하며, 그들의 비전을 관객들이 볼 수 있는 작품으로 완성하는 사람들이다. 만약에 어떤 영화감독이 어떤 한 요소, 예를 들자면 특수효과에만 치중해 영화를 만들면 그 결과물은 두 시간을 앉아서 봐주기도 어렵게 되는 수가 있다. 데이터 비즈니스도 이와 마찬가지다.

그렇다면 필자가 데이터 사이언티스트가 되고자 하는 젊은이들에게 하고자 하는 충고는 어떤 것들인가. 일단 기본에 충실할 것이며 맡은 분야에서 진정한 전문가가 되라는 것이다. 그것이 프로그래밍이나 코딩이던, 통계나 수학이건, 적성에 맞는 분야를 찾아 거기서 뛰어난 사람이 먼저 돼야 한다. 하지만 다른 관련 분야에도 지속적인 관심을 가질 필요가 있다.


"기본에 충실하며, 맡은 분야에서 진정한 전문가가 되라"

또한 세계를 여행하며 사람들이 살아가는 여러 가지 모습들을 관찰하라고 권하고 싶다. 인간심리에 관한 이해를 넓히기 위해 영화도 많이 보고 책도 많이 읽기를 권한다. IT 관련 서적만 골라서 볼 것이 아니라 심리학, 사회학, 철학, 일반과학, 경제학, 마케팅 책들도 전공 수준은 아닐지라도 참고삼아 읽어보는 것이 바람직하다. 시야가 넓어지면 입장을 바꿔보는 것도 수월해지기 때문이다.

그리고 이 데이터 산업은 종국에는 어떤 조직을 위해 수익을 창출하는 일에 연관이 되게 마련이다. 그러므로 컴퓨터 시스템뿐 아니라 비즈니스의 생태계에서도 관심을 깊게 가져야 한다. 빅데이터 운동의 많은 부분은 마케팅이 차지하고 있기 때문에 일단 정보를 많이 가진 소비자가 돼봐야 한다. 그런 후에는 광고나 마케팅 캠페인을 성가셔하는 소비자의 입장이 아니라 그런 것들을 기획한 사람들의 입장에서 보는 연습을 하는 것이 좋다.

가진 정보를 많이 활용하는 소비자로서 온라인이건 오프라인이건 여러 구매 채널을 사용해보는 것도 필요하다. 그리고 미래에는 어떻게 이 ‘거래’라는 기본적인 개념이 단순히 삼성페이나 애플페이 등 모바일 앱 정도로  멈추지 않을 것이 분명한 여러 기술의 발달을 통해 그 모습을 바꾸게 될 지도 상상해보라. 가까운 미래에 우리는 ‘물건을 가지고 지나가기만 해도’ 결제가 되는 세상에 살아가게 될 것이며, 오프라인에서도 온라인에서와 같이 구매, 할인과 지불이 동시에 이루어지며, 거기에서 파생되는 데이터 또한 엄청나게 정확하고 다양하고 많아질 것이다.

그런 모든 기술적, 사회적 변화는 데이터를 이해하는 사람들에게는 기회로 이어진다. 만약 사업이 될 만한 기회가 보인다면 구체적 아이디어를 중심으로 어떻게 하면 창업을 할 지 연습으로라도 생각해볼 것이며, 그러다보면 기술적인 해답을 얻는 것은 창업과정의 극히 일부분에 지나지 않는다는 것도 깨닫게 될 것이다.

만약에 이미 데이터 사이언티스트라는 직함을 갖고 있다면 그런 타이틀에 어울리도록 모든 행동과 의사결정 과정을 기술적인 방향(Technology-oriented)이 아니라 해결을 중심으로 한 방향(Solution-oriented)으로 잡아야 한다. 기술의 노예가 돼 흔히 말하는 ‘Data Plumber’, 즉 하염없이 데이터만 이리저리 옮겨놓는 사람이 되지 말고, 대신 사람들의 질문에 대한 효과적인 대답을 창출해낼 수 있는 데이터의 마스터가 돼야 한다.

그리고 가장 중요한 것은 구글이 늘 말하듯이 ‘Don't be evil’, 즉 악의 길로 빠지지 말고, 할 수 있는 일이라고 다 하지 말라는 것이다. 데이터를 잘못 다루면 실제로 다치는 사람들도 생기고 부정적 영향도 있으니, 항상 하는 일의 사회적 영향도 고려해야 한다(이 주제에 관해 앞으로 더 자세히 다룰 것임).

이 빅 데이터의 웨이브를 장시간 유지하고 싶다면, 데이터 비즈니스를 잘 이해하지 못하는 사람들을 화나게 만들지 않는 것도 아주 중요한 일이다. 이상한 짓을 해서 정도를 따라 데이터를 다루는 사람들에게까지 피해가 가게 하면 안 된다.


'새로운 타입의 전문가', 어떻게 지속적으로 길러낼지 함께 고민해야

필자는 몇 년 전부터 실업률이란 '기술의 발전으로 인해 사회가 변화하면서 도태돼가고 있는 사람들의 비율'이라는 생각을 하고 있다. 그래서 과학과 기술의 발전이 반드시 사회적 발전으로 이어지는 것은 아니라고 말할 수 있는 것이다. 산업혁명 이후로 모든 사회의 진화적 단계는 새로운 기술을 가진 사람들에 대한 수요와 공급 간의 괴리를 만들어왔고, 현 시대도 예외가 될 수 없다.

불행하고도 아이러니한 현실은 높은 실업률에도 불구하고 정작 하이테크 일자리는 채우기가 쉽지 않다는 것이다. 이런 현상의 배후에는 많은 사람들이 과거의 패러다임 아래에서 교육을 받았고 지금도 받고 있다는 사실이 있다.

데이터 산업이 갖고 있는 딜레마는, 정작 새로운 기술을 이용해 비즈니스의 요구를 충족시킬 수 있는 인재는 어느 나라에서건 드물다는 것이다. 후자의 경우와 같이 데이터와 기술, 그리고 비즈니스를 접목시켜 가치를 창출하는 것이 데이터 사이언티스트들이 하는 일이라면, 현대 사회에서 그런 사람들을 더 많이 필요로 한다는 것은 자명하다.

하지만 그런 인재를 다량으로 길러내는 것은 단지 몇몇 사람들과 기관들이 단독으로 할 수 있는 일이 아니며, 교육과 인재양성에 관한 사회 전반의 인식까지도 바뀔 필요가 있다. 사업하는 사람을 비롯한 교육전문가들과 학부형들도 과연 그런 새로운 타입의 전문가들을 어떻게 지속적으로 길러낼 것인가에 대해 고민을 해야 하며, 그러려면 일단 그 데이터 사이언티스트란 직업에 대한 현실적인 정의부터 우선돼야 한다. 그것이 도대체 어떤 일을 하는 직업인지에 대해서도 의견이 분분하고 구름 잡는 얘기만 떠돌아다닌다면, 실제로 필요한 전문인재들을 많이 배출해낸다는 것 자체가 허황된 탁상공론으로 끝나기 십상이기 때문이다.

많은 한국의 학부형들은 스티브 잡스를 존경한다고 서슴없이 말하며, 이 사회에서는 그와 같이 기술을 이용해 꿈을 이루는 선각자(Visionary)가 많이 필요하다고들 한다. 하지만 정작 자신의 자녀가 잡스처럼 멋대로 굴고 난데없이 전공분야도 아닌 인문과 예술 쪽 강의나 듣고 다니다가 학교를 중퇴해 버리고, 취직은 아예 생각도 안하고 창업부터 하겠다고 덤비면 그야말로 혼비백산을 할 부모들이 거의 전부라고 해도 과언이 아닐 것이다. 하지만 앞으로의 시대는 그와 같이 분야를 겁 없이 넘나들며 남의 입장에서 세상을 볼 수 있는 사람들이 필요한 것이다.

수학이나 통계나 프로그램 개발을 아무리 귀신같이 잘해봐야 컴퓨터의 발전이 지금 단계에서 멈추지 않는 이상 조만간 사람이 기계를 이길 수 없게 될 것이다. 하지만 주어진 데이터와 기술을 활용해 기존에 없던 새로운 가치를 창출해내고 사업의 기회를 만드는 것은 여전히 꿈을 꿀 수 있는 사람들이 할 일이다.

분명한 점은 시험성적만 좋고 소위 말하는 스펙만 물샐 틈 없이 완벽하다고 그런 능력이 저절로 생기는 건 결코 아니란 것이다. 즉 데이터 사이언티스트의 현실적 정의가 무엇이건 그 끝에는 인간의 상상력이 더해져야 한다는 말이다.

이러한 변화는 바로 근접한 미래에 비단 데이터 전문가들에게만 적용되는 것이 아니게 될 터이니, 지금의 이 ‘빅데이터’ 유행이 “컴퓨터가 사람보다 더 똑똑해져도 여전히 가치를 창출할 수 있는 인간들”을 키우는 발상의 전환의 계기가 됐으면 한다.

세상은 하루가 다르게 변하고 있는데, 그 어떤 관행에 대한 변화도 거부하고 과거의 잣대만을 고집하며 수십 년 전에 만들어진 참고서에 대한 이해도를 기준으로 여전히 아이들을 재단하며 틀에 가둘 것이라면, 아예 스티브 잡스의 이름을 섣불리 들먹이거나 데이터 사이언티스트란 말을 함부로 꺼내지도 않는 게 나을 것이다.

잔인하게 들릴 수도 있겠지만 변화를 주도하는 주체가 되지 못하면 시험성적이 아무리 좋은 젊은이나 지금 잘나가는 하이테크 분야에 있는 사람들도 도태되는 것은 잠깐일 수 있는 미래가 곧 닥쳐오고 있다.

인기기사 순위
(우)08503 서울특별시 금천구 가산디지털1로 181 (가산 W CENTER) 1713~1715호
TEL : 02-2039-6160  FAX : 02-2039-6163  사업자등록번호:106-86-40304
개인정보/청소년보호책임자:김선오  등록번호:서울 아 00418  등록일자:2007.08  발행인:김용석  편집인:김선오