[아이티데일리] 성안당(대표 이종춘)은 ‘빅데이터 전문가의 하둡 관리’를 출간한다고 2일 밝혔다.

이 책은 빅데이터와 머신러닝의 시대에 꼭 필요한 전문가인 ‘하둡 관리자’가 되기 위한 내용들을 담았다. 하둡 생태계 컴포넌트들인 아브로, 플룸, HBase, HCatalog, 하이브, 휴, 카프카, 머하웃, 우지, 피그, 스쿱, 스톰, 테즈 등 하나하나가 책 한 권으로도 나와 있을 만큼 큰 주제들을 빠짐없이 소개하고 언급한다.

원서 ‘Expert HADOOP Administration’의 저자인 샘 R. 알라파티(Sam R. Alapati)는  하둡 관리자로서의 기술적인 배경과 집필 경험이 풍부하다. 저자는 이 책을 통해 하둡에 대한 큰 그림을 볼 수 있도록 해준다.

하둡 생태계에서 크게 얀과 하둡 분산 파일 시스템(HDFS)을 배치하면서 하둡으로 배치, 인터랙티브, 실시간 데이터 접근을 위해 ▲스크립트로는 피그, SQL로는 하이브, 스파크, 자바 ▲스칼라로는 캐스케이딩, ▲스트림으로는 스파크 스트리밍, ▲인메모리로는 스파크, ▲검색으로는 솔라(Solr), ▲NoSQL로는 HBase와 어큐뮬로, ▲머신러닝으로는 스파크 MR과 스파크 R 등을 사용한다며 하둡의 핵심 컴포넌트와 툴을 한눈에 보여준다.

또 하둡을 관리하기 위해 알아야 하는 것, 하둡 1과 2의 차이점을 다룸으로써 하둡 3 시대에도 대비할 수 있도록 하며, 하둡 관리의 핵심 영역까지 소개한다.

역자 안진섭씨는 SAP코리아에서 데이터베이스 엔진을 개발하면서 하둡에 대한 경험을 풍부하게 보유한 프로그래머로, 이 책을 상세하고 이해할 수 있는 수준까지 번역하고자 애썼다.

이 책은 크게 5부 21장으로 구성돼 있다. 1부에서는 하둡의 아키텍처와 하둡 클러스터를, 2부에서는 하둡 애플리케이션 프레임워크, 3부에서는 하둡 데이터 관리 및 보호, 고가용성, 4부에서는 데이터 이동, 리소스 할당, 잡 스케줄링, 보안, 5부에서는 모니터링, 최적화, 문제 해결 등을 다룬다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지