R의 다양한 함수 통해 데이터를 '이해하고 기억하기 쉽게' 바꾸는 방법

 
[아이티데일리] 한화생명 유충현 차장과 홍성학 씨가 ‘R을 활용한 데이터 시각화’(출판 인사이트)를 펴냈다.

신간 ‘R을 활용한 데이터 시각화’는 R이 제공하는 다양한 함수를 통해서 데이터를 인상적인 그래프나 플롯으로 표현하는 방법을 알려준다. 또한 사용자가 직접 만든 사용자정의 함수를 적용해 더욱 다채로운 시각화가 가능하도록 구성하고 있어, 고급 활용법까지 학습하고 싶은 모든 이에게 적합하다. 약 900쪽의 방대한 분량에서 제공하는 수많은 예제를 학습하다 보면 어느덧 R은 물론 데이터 시각화 기법에도 능숙해질 것이다.

R은 역사가 오래된 통계 및 데이터 분석용 언어다. R은 프로그래밍 언어임에도 데이터 시각화 기능에 필요한 많은 기능을 포함하고 있다. R의 시각화가 강력하다는 의미는 속도나 사용자 친화적인 인터페이스 등을 말하는 것이 아니다. 다양한 시각화를 빠른 시간에 만들 수 있는 기본 기능과 부가 확장 기능을 가지고 있다는 것이다.

사람은 숫자보다는 그림에 더 빨리 집중하고 오랫동안 기억한다고 알려져 있다. 데이터로부터 패턴이나 규칙성 그리고 알려지지 않은 사실을 알아내는 작업은 수학에 예민하지 않은 일반적인 사람에게는 어려운 일이다. 이러한 사람에게는 데이터를 가공해서 분석하고 이해하기 위해 숫자를 그림으로 바꾸는 ‘데이터 시각화’가 훨씬 효과적이다.

고려대 통계학과 허명회 교수는 추천사를 통해 “R은 오픈소스이며, 수많은 자발적 기여가 있었고, 가변성이 뛰어나다는 점이 장점이나, R의 사용법을 정확히 설명해주는 문서와 교재가 아직은 부족하다는 것이 단점.”이라며, “이 책은 R의 데이터 시각화에 관한 한 최고의 결정판이다.  R 사용자에게 데스크 레퍼런스로서 정말 유연할 것”이라 밝혔다.

데이터 시각화는 단순히 도형을 이용해서 데이터를 아름답게 꾸미는 것을 뜻하지 않는다. 이 책의 공동저자 홍성학 본부장은 저자 서문을 통해 데이터 시각화의 핵심이 “이해하기 쉽고 기억하기 쉽게 만드는 것”이라면서, “빠른 인사이트를 도출하기 위한 유연한 시각화 기법을 익히는데 도움이 되길 바란다”고 밝혔다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지