강지훈 피키캐스트 데이터사이언스실장

[컴퓨터월드] 빅데이터라는 IT트렌드를 굳이 거론하지 않더라도, 이제는 많은 기업들이 데이터 분석의 가치와 중요성에 대해 인식하고 있다. 그러나 데이터 사이언스가 경쟁에서 도태되지 않기 위한 필수적인 요소로 그 자리를 잡아가고 있는 반면, 이에 요구되는 데이터 분석역량 내재화를 이룬 곳을 찾기란 쉽지 않다.

이 가운데 최근 성장을 거듭하고 있는 한 스타트업에서 데이터 사이언스 조직을 성공적으로 꾸렸다고 평가돼 주목받고 있다. 그 주역인 강지훈 피키캐스트 데이터사이언스실장을 만나 조직의 구성 및 운영, 그리고 빅데이터와 데이터 사이언티스트에 대한 견해를 물었다.

▲ 강지훈 피키캐스트 데이터사이언스실장

주요 약력
- 로앤비 (2005-2007)
- 넥슨 플랫폼실 (2007-2009)
- 다음 검색 및 다음카카오 추천검색팀 (2009-2015)
- 피키캐스트 데이터사이언스실 (2015- )

 

강지훈 피키캐스트 데이터사이언스실장은 대학교에서 컴퓨터공학을 전공, 데이터 엔지니어로서 그의 커리어를 시작했다. 당시 2000년대 중반은 실리콘밸리를 중심으로 한 빅데이터의 태동기였고, 점차 데이터 엔지니어링 학회에서도 기계학습(머신러닝)을 다루기 시작하던 시기였다. 강 실장은 이미 상당 수준 고도화된 데이터 엔지니어링 분야보다는 데이터 분석 및 기계학습 분야의 가능성에 점차 관심을 갖게 됐고, 주경야독하며 전향을 준비했다.

“데이터 사이언스라는 분야가 개발, 수학, 통계, 물리 등 다양한 학문의 조합이라, 이론적 부분을 채우면 구현부는 이득을 얻는 점이 있어 학습에 큰 도움을 받았다”는 것이 그의 설명이다. 다음에 입사하면서부터 본격적으로 데이터 분석 업무를 수행, 다양한 다음 카페에서 생성되는 수많은 데이터를 활용하고 실시간 검색어 순위 시스템도 담당하는 등 차근차근 경험을 쌓아왔다.

최근 스타트업 붐을 주시하면서 새롭게 데이터를 활용할 수 있는 기회를 꿈꾸던 강 실장은 옐로모바일의 콘텐츠 큐레이션 앱 서비스인 피키캐스트로의 이적을 택했고, 합류 이후 데이터 사이언스 조직을 구성하고 운영하는 임무를 맡아 성공적으로 추진하고 있다는 평가를 받고 있다. 이에 ‘스타트업과 데이터 사이언스’에 대한 그의 견해를 문답 형태로 정리했다.

 

스타트업에서 데이터 사이언스 조직을 만들었는데.

피키캐스트는 콘텐츠 큐레이션 서비스인데, 반년 전에 막상 와보니 데이터 관리가 전무하더라. 차라리 잘 됐다고 생각하고 처음부터 만들어나갔다. 데이터 설계, ETL, BI, 검색, 추천, 개인화 등을 6개월 내 구현한다는 계획을 세워 진행했다. 자사에 최적화된 시스템을 마련하기 위해 주로 자체 개발하거나 공개SW를 활용했고, 현재는 80% 정도 완료해 구현은 마치고 성능 측정과 실제 적용 준비를 하고 있다.

피키캐스트 데이터사이언스실은 전공의 다양화에 초점을 맞추고 조직했다. IT개발, 수학통계, 경영 등 다양한 지식이 필요하다고 여겼기 때문이다. 이 분야에서 5년 이상 경력자는 거의 없는 것이 현실이라 적합한 인재의 채용이 쉽지는 않았다. 그래서 서로 시너지를 내 단기간에 성과를 낼 수 있도록, 각자가 주업무 외에 부업무도 맡으며 관련 역량을 키울 수 있게끔 구성했다. 데이터 사이언스 분야 특성상 한 사람이 모든 것을 다 잘하기는 현실적으로 힘들기 때문에 더욱 조직이 필요한 것이다. 현재는 총 8명으로 구성됐다.


데이터 사이언스 조직을 구성하며 가장 중시했던 부분은.

내부적인 관계 정립이다. 일반적으로 분석조직이 기획 또는 개발의 큰 조직에 소속되는 경우가 상당히 많다. 그러나 개발조직은 장애를 최소화시키는데 중점을 두는 반면, 분석조직은 새로운 도전을 꾀하는 입장이다. 데이터 사이언스 분야의 특성상 기획된 서비스를 평가하거나 개발조직에게 성과와 무관한 업무를 요청할 상황이 많다보니, 기획조직 및 개발조직과 대립관계를 유지하고 같은 수준으로 협상 및 논쟁할 수 있어야 한다고 생각했다.

분명히 성과 자체가 기획과 개발 그리고 비즈니스 조직과 대립관계에 있음에도 조직이 대립을 할 수 없다면, 절대로 데이터사이언스 조직은 올바르게 일할 수 없고 성과를 낼 수 없게 된다. 데이터 사이언스가 회사의 성장동력이 될 수 있다는 점을 설득, 충분히 자기 역할을 할 수 있도록 환경이 조성돼야 한다. 이를 위해 내부적인 분석결과 공유와 이에 대한 협조가 원활하게 이뤄질 필요가 있다.


피키캐스트 데이터사이언스실은 데이터를 어떻게 활용하고 있나.

내부 고객인 사내 직원들을 위해 지표를 설계하고 판단할 근거를 제공하며, 전사 데이터에 대한 오너십을 갖고 생성·가공·도출의 모든 일을 하고 있다. 피키캐스트 서비스 현황을 한눈에 볼 수 있는 대시보드를 제공하며, 콘텐츠 에디터나 경영에 필요한 자료를 실시간으로 얻을 수 있는 관리도구를 지원하고 있다. 또한 콘텐츠 검색엔진 개발 및 모델링, 자동완성 등 검색어 서비스, 추천 엔진, 개인화 서비스, 타임라인 모델링 등 서비스에 필요한 모든 작업을 수행하고 있다. 옐로모바일 내 다른 서비스들과의 데이터 관련 협력도 준비 중이다.

이용자들에게 보다 나은 서비스를 제공하기 위해서는 입력된 자료를 활용하지 않고 행동 분석을 주로 하고 있다. 이용자가 30대 남자로 입력됐다고 해서 실질적인 분석 없이 그것만으로 뭔가 추천하고 강요하는 것은 폭력과 같다고 느낀다. 기존 대기업이나 포털 등에서 한 가지 업무만 해도 수많은 작업자가 참여해 수개월이 소요되는 것에 비해, 자사는 최소한의 인원으로 그와 비슷한 수준의 결과물을 주 단위로 내놓고 있다. 이는 뛰어난 인재들이 모였음은 물론, 스타트업의 특징인 빠른 의사결정, 그리고 팀워크와 열정의 힘이라고 여겨진다.


데이터 사이언티스트란 어떤 사람이라고 보는가.

다른 분야에 있다가 데이터 사이언티스트가 되기 위해 일정기간 준비해 배우면서 일하는 사람들이 대부분이다. 아직까지는 수요대비 공급이 매우 적은 상황이고, 이를 교육할 사람도 매우 적은 편이다. 기업들은 그 중요성이 커지고 있고 인기가 높아지고 있다는 점은 알지만, 실질적으로 데이터 사이언스가 어떤 분야인지 그 자체를 모르는 경우도 흔하다. 이제는 이에 대해 이해하고 내부적으로도 적절한 관계를 형성하며 발전적인 방향으로 나아가야 할 때다.

데이터 사이언티스트가 되기 위해서는 통계나 수학, 프로그래밍이나 시스템, 그리고 직관적 도메인 능력을 스스로 전문분야로 한 가지 갖추고, 나머지 분야도 잘해야 한다. 개발자도 풀스택이 있듯, 주력 분야와 함께 이론적 배경을 강화하고 구현할 수 있는 능력을 기르며, 그 스킬을 토대로 신규 서비스를 하거나 마케팅 방법을 제시하는 등의 능력이 있어야 한다고 생각한다.

기업이 새로운 경쟁력을 갖기 위해서는 이제 데이터 주도 경영과 기계학습을 통한 서비스를 통해 차별화된 서비스를 제공할 수 있어야 한다. 그 핵심인 데이터 사이언티스트의 대우 및 입지가 더 좋아지기를 바란다. 그러나 단 6개월에서 2년 정도의 과정을 통해 정부에서 데이터 사이언티스트를 대거 양성하는 것은 반대하는 입장이다. 데이터 사이언티스트는 이론이 기반이 돼야 하는 직업이며, 단기간에 만들어질 수 없다.


그간 데이터를 다루면서 느낀 점이 있다면.

데이터 사이언스는 이론적 배경과 구현할 수 있는 능력 위에 도메인에 대한 분석을 업으로 하는 일이다. 데이터 사이언티스트가 사용하는 알고리즘은 복잡한 딥러닝이라도 실제 구현부는 얼마 안 되는 경우가 대부분이다. 하지만 개발을 전공하거나 주업으로 하는 사람들의 특성상 이론적인 부분을 멀리하고 결과만 빨리 도출하려는 경우도 많다.

그 답답함을 조금만 참고, 수학적 이론과 통계적인 방법, 데이터 분석 방법 및 기계학습을 익히면 보다 빠르게 성장을 이룰 수 있다. 이론 및 구현능력과 더불어 복잡하고 어려운 도메인을 하나하나 해석해서 모델링해 준비한다면, 그 도메인 안의 어떠한 일이 생기더라도 준비된 체계 안에서 해결 가능하다. 즉 피처(feature)를 평소에 잘 모으고 관리하면, 새로운 이슈나 분석에 그 기존 틀로 해결할 수 있는 가능성이 커졌던 것 같다.

데이터 사이언스 조직에서도 이러한 내용을 체계화, 구성원들이 각자 주관적·객관적 피처와 모델을 만들고 이를 유기적으로 결합해 플랫폼화할 수 있도록 구축해야 한다. 또한 조직 내 구성원들이 더 많이 배우고 열정을 쏟아낼 수 있도록 지원하면 어떠한 분야에서도 최고의 성과가 나오는 조직을 만들 수 있다고 생각한다.

 

인터뷰를 마치면서 강지훈 피키캐스트 데이터사이언스실장은 앞으로 데이터사이언스실 구성원들이 독립적으로 업무를 수행할 수 있도록 각자 역량을 강화하는 것을 돕는 한편, 개인적으로는 품질 성과를 내기 위한 연구에 집중할 계획이라고 설명했다.

올 하반기에는 피키캐스트가 당면한 콘텐츠 저작권 관련 문제를 해결하기 위해 이미지 분석을 활용한 분류 작업을 실시할 계획이다. 이어 검색 서비스 개선과 개인화 추천 기능 강화도 진행할 예정이다. 물론 내부적인 의사결정 지원활동은 지속적으로 전개할 방침이다.

강지훈 실장은 “그간 데이터 사이언스 조직을 꾸리느라 잠시 소홀히 했던 이론적인 공부와 업계 동향 파악에도 신경 쓰려 한다”면서, “언젠가는 개발까지 아우르는 총괄 조직을 맡아 이끌어보고 싶다”고 포부를 밝혔다.

▲ 강지훈 피키캐스트 데이터사이언스실장은
분석조직이 기업의 성장을 이끌 수 있는 환경이 조성돼야 한다고 강조했다.

관련기사

저작권자 © 아이티데일리 무단전재 및 재배포 금지