아파치 2.0 기반 오픈소스 프로젝트…구축시간 단축, 생산성 향상 통해 비즈니스 역량 집중

 
[아이티데일리] 한국테라데이타가 아파치 하둡(Apache Hadoop), 아파치 스파크(Apache Spark), 아파치 나이파이(Apache NiFi)와 같은 최신 오픈소스를 기반으로 하는 데이터 레이크(data lake) 관리 소프트웨어 플랫폼 ‘카일로(Kylo)’를 13일 공개했다.

아파치 2.0 라이선스 기반으로 제공되는 오픈소스 프로젝트 ‘카일로’는 자회사인 씽크 빅 애널리틱스(Think Big Analytics)의 데이터 레이크 분야 구축 경험을 통해 획득한 코드에서 출발해 발전시킨 것으로, 데이터 레이크를 구축하려는 기업들에게 높은 효율성과 유연성을 제공하게 된다.

기업들은 ▲데이터 레이크 구축에 많은 시간이 소요 ▲6~12개월마다 사용 케이스의 효용 가치 하락 ▲급변하는 비즈니스 환경에 실제적인 연관성 하락 등 다양한 문제들을 경험해왔다. 또한 소프트웨어 가격이 하락해도 엔지니어링 가격은 급격하게 증가하고, 구축된 데이터 레이크 내에서도 탐색 기능을 활용하기 어려워 사용자들의 접근성이 떨어지는 결과가 발생했다.

여러 산업의 데이터 레이크 구축 경험을 바탕으로 한 카일로(Kylo)는 파이프라인 개발 및 공통의 데이터 관리 작업을 통합해 효율화시키기 때문에 ▲가치 실현 시간 단축 ▲사용자 채택 증가 ▲개발자 생산성 향상 등의 결과를 낳게 된다.

또한 코딩을 하지 않아도 셀프 서비스 데이터 수집 및 데이터 랭글링(wrangling)을 위한 직관적인 사용자 인터페이스를 제공해 개발 과정을 가속화시킬 수 있으며, 재사용 가능한 템플릿을 통해 생산성을 향상시킬 수 있다.

기업들이 데이터 레이크 실행 시에 직면하게 되는 ▲소프트웨어 엔지니어 및 관리자들의 기술 숙련 ▲데이터 레이크 가버넌스에 대한 베스트 프렉티스 학습 ▲엔지니어 외에 데이터 레이크 채택 확장 등의 과제들을 해결할 수 있을 것으로 예상된다.

올리버 레츠버그(Oliver Ratzesberger) 테라데이타 최고제품책임자(CPO) 겸 수석 부사장은 “‘카일로’는 데이터 레이크 관리 분야에서 처음 시도된 오픈소스 프로젝트”라며, “빅데이터, 분석, 오픈소스 소프트웨어에 대한 테라데이타의 비전을 보여주는 것”이라고 말했다.

릭 파넬(Rick Farnell) 씽크빅(Think Big) 대표는 “오픈소스 소프트웨어는 맞춤형 구축을 위한 유연성과 실험성, 협업 학습, 독립성 등을 추구하는 사용자들에게 적합하다”라며 “‘카일로’는 소프트웨어 및 서비스에 대한 테라데이타 에브리웨어(Teradata Everywhere) 접근법과 함께 미래를 위한 혁신 전략의 가장 좋은 예가 될 것”이라고 덧붙였다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지