IT 성능관리 새로운 트렌드로 부상하는 ‘옵저버빌리티’

[아이티데일리] 클라우드가 IT 환경의 기반 인프라로 자리매김하면서 IT 성능관리 업계에 주요한 변화가 포착됐다. 바로 IT 성능관리 혁신 방법론인 ‘옵저버빌리티(Observability)’다. 옵저버빌리티는 얼럿(Alert), 메트릭(Metric) 중심의 단순 모니터링(Monitoring)보다 기능적으로 고도화되고 통합에 초점이 맞춰진 개념이자 방법론이다. 애플리케이션 성능관리(APM)과 데이터베이스 성능관리(DBPM) 등 특정 영역에 국한된 포인트 솔루션 기업들 역시 옵저버빌리티 기반 통합 플랫폼을 제공하고자 전사적 노력을 쏟고 있다.

대표적으로 엑셈, 와탭랩스, 제니퍼소프트 등 3곳의 기업은 단순히 모니터링을 위한 데이터를 수집하는 것이 아닌, 이를 분석하고 시각화해 IT 팀이 신속하게 결정을 내릴 수 있도록 돕는 통합 플랫폼을 개발하고 있다. 이들 기업이 자체 개발한 옵저버빌리티 플랫폼을 3회에 걸쳐 소개한다. 이번 2회에서는 와탭랩스의 ‘와탭 옵저버빌리티 플랫폼’을 소개한다.


기존 모니터링 포괄하는 광의적 방법론

최근 포인트 솔루션으로 충당하지 못하는 클라우드 기반 IT 환경에 대한 성능관리에 적합한 방법론으로 ‘옵저버빌리티(Observability)’가 부상하고 있다. 옵저버빌리티는 직역하면 ‘관찰할 수 있음’, ‘식별 가능성’, ‘주목할 만함’이라는 뜻을 가진 명사다. IT 성능관리 분야에서의 옵저버빌리티는 ‘시스템이나 애플리케이션, DB 등 전반적인 IT 운영환경을 충분히 이해하는데 요구되는 메트릭(Metric), 트레이스(Trace), 로그(Log) 등 모든 데이터를 수집하고 통합해 분석하는 것’을 의미한다. 기존 모니터링을 포괄하는 광의적인 개념이자 방법론이다.

와탭랩스 김성조 CTO는 “옵저버빌리티 방법론의 핵심 요소는 메트릭, 트레이스, 로그 등 세 가지다. 또 세 가지 핵심 요소를 통합해 IT 시스템 전반에서 발생하는 데이터를 실시간으로 수집하고 분석할 수 있어야 한다. 메트릭은 시스템의 성능 지표를, 트레이스는 분산된 서비스 간의 호출 경로를, 로그는 시스템 이벤트 등을 각각 보여주는데, 이 데이터를 통합적으로 분석함으로써 IT 운영자는 문제의 근본 원인을 빠르게 파악할 수 있다”고 설명했다.

옵저버빌리티 방법론이 반영된 시중의 플랫폼은 IT 운영환경을 모니터링하는 것을 넘어 시스템이 어떻게 운영되고, 무엇이 문제인지를 통찰력 있게 파악할 수 있도록 지원해 문제의 원인을 자동으로 식별하고, 비정상적인 이상 상황을 예측해 신속하게 대응할 수 있도록 돕는 기능까지 담겨있다.

엑셈 류길현 전무는 “자사의 A 고객사는 클라우드 기반 MSA 환경으로 전환하면서 기존 모니터링 방식으로는 애플리케이션 간 의존성을 추적하는 데 한계를 느꼈다. 하지만 자사를 통해 옵저버빌리티를 구현한 이후 각 서비스의 상호작용을 시각화하고 문제를 신속히 식별할 수 있게 됐다. 이는 장애 대응 속도를 대폭 높였을 뿐만 아니라 다운타임을 줄여 고객 경험을 개선하는 데 크게 기여했다”고 설명했다.

제니퍼소프트 이현철 CTO는 “기존 단순 모니터링과 달리 옵저버빌리티는 광범위한 데이터 수집 및 분석, 클라우드 네이티브 환경에 부합한 확장성과 유연성, 쿠버네티스 환경에 대한 모니터링, 마이크로서비스 간 연관성을 고려한 통합적 접근 등에 강점을 갖는다”고 말했다.


핵심은 ‘통합’과 ‘데이터 연계·분석’

IT 성능관리 분야에서 모니터링은 시스템 이상을 식별하고 상태를 감시할 수 있는 필수 기술로 꽤 오랜 시간 자리 잡아왔다. 하지만 기존 모니터링은 사전 정의된 임계치를 초과할 때만 경고를 생성하는 반응형 방식에 그치며, 근본 원인 분석이나 문제 예측에는 한계가 있었다. 또한 데이터를 포인트 솔루션별로 처리하기에 분산된 시스템 간 연계성이 부족해 전체적인 관점에서 문제를 진단하기 어려웠다.

옵저버빌리티에는 위와 같은 문제를 해결할 수 있는 2가지 핵심 기능이 있다. 바로 ‘포인트 솔루션들의 통합’과 ‘데이터 연계·분석’이다. 먼저 옵저버빌리티는 기존의 포인트 솔루션(APM, DBPM 등)을 단일 플랫폼에 통합해 다양한 소스의 데이터를 하나로 연결한다.

구체적으로 지금까지의 모니터링과 다르게 여러 시스템 및 솔루션에서 수집한 다양한 소스 데이터를 연관성 있는 시스템에서 발생한 데이터와 실시간으로 연계·분석함으로써 전체적인 관점에서 문제를 파악할 수 있다. 이때 이용되는 데이터가 바로 메트릭 데이터, 트레이스 데이터, 로그 데이터다. 이 세 가지 데이터를 일련의 데이터 프로세스 흐름으로 묶어, 각각의 데이터가 가진 맥락(context)을 이해하고 이를 상호 연결해 문제를 진단한다.

예를 들어 특정 애플리케이션에서 처리 속도가 저하될 경우, 옵저버빌리티는 트레이스 데이터를 통해 호출된 서비스 간의 연쇄적 영향을 추적하고, 로그 데이터를 활용해 구체적인 이벤트를 분석하며, 메트릭 데이터를 통해 전체적인 성능 저하의 원인을 파악한다. 이러한 통합적인 분석은 문제를 신속히 진단할 수 있게 하며, 전통적인 모니터링 도구로는 얻을 수 없는 가치를 제공한다.

제니퍼소프트 MSA 모니터링 토폴로지 뷰 (출처: 제니퍼소프트)
제니퍼소프트 MSA 모니터링 토폴로지 뷰 (출처: 제니퍼소프트)

특히 금융 서비스와 같이 실시간 데이터 처리에 민감한 산업에서는 데이터 연계·분석의 중요성이 더욱 강조된다. 고객의 거래 요청이 처리되는 동안 시스템 전반에서 발생하는 모든 데이터를 통합적으로 분석해 지연이 발생한 지점을 빠르게 확인할 수 있다. 이러한 통합적 접근은 고객 신뢰를 유지하고 서비스 품질을 보장하는 데 필수적이다.

옵저버빌리티의 핵심은 단순히 개별 시스템에서 데이터를 수집하는 것이 아닌, 데이터를 연계하고 분석해 의미 있는 통찰력을 도출하는 것이다. 이를 통해 IT 운영팀은 복잡한 시스템에서도 문제의 근본 원인을 쉽게 파악하고, 향후 발생할 수 있는 잠재적인 문제를 예방할 수 있다. 이러한 요소는 클라우드 환경에서 필수적으로 요구되는 예측 가능성과 운영 안정성을 확보하는 데 핵심적인 역할을 하기도 한다.
 

와탭랩스 CI
와탭랩스 CI

와탭랩스 “뒷단 시스템 데이터 수집부터 연계, 분석까지 지원”

국내 SaaS 모니터링 전문기업인 와탭랩스는 옵저버빌리티를 전면에 내세우며 비즈니스 확대에 총력을 기울이고 있다. 와탭랩스가 핵심으로 내세운 플랫폼은 ‘와탭 옵저버빌리티 플랫폼’이다.

와탭랩스는 애플리케이션이나 시스템의 수치 측정을 뜻하는 메트릭(Metric)과 추적데이터인 트레이스(Trace), 시스템 활동을 이해하고 문제를 진단하는 데 사용되는 시스템 관련 메시지 로그(Log) 등 세 가지 핵심 지표를 옵저버빌리티 플랫폼으로 제공해 고객이 실시간으로 수많은 데이터를 한눈에 볼 수 있도록 지원한다. 와탭 옵저버빌리티 플랫폼은 각 서비스를 플랫폼 서버로 통합해 개별 관리자 없어도 통합·운영이 가능하다.

와탭 옵저버빌리티 플랫폼 (출처: 와탭랩스)
와탭 옵저버빌리티 플랫폼 (출처: 와탭랩스)

특히 와탭 옵저버빌리티 플랫폼의 기능으로 △와탭 애플리케이션 모니터링 △와탭 서버 모니터링 △와탭 데이터베이스 모니터링 △와탭 쿠버네티스 모니터링 △와탭 로그 모니터링 △와탭 URL 모니터링 △와탭 브라우저 모니터링 △와탭 네트워크 모니터링 등이 있다. 이 중에서도 와탭랩스는 쿠버네티스 모니터링을 강조하고 있다.

와탭랩스의 쿠버네티스 모니터링은 서드파티 제품 없이 와탭 에이전트만으로 쿠버네티스 모니터링, 애플리케이션 모니터링, 로그 모니터링 결과를 수집할 수 있고, 수집된 데이터를 와탭의 자체 DB에서 통합 저장하고 분석할 수 있다. 이를 바탕으로 지속적으로 변화하는 모니터링 대상을 한눈에 볼 수 있는 옵저버빌리티를 제공한다.

고객은 컨테이너 뷰 모드, 파드 뷰 모드 등 개별 컨테이너화된 애플리케이션과 쿠버네티스 최소 배포 단위를 모니터링할 뿐 아니라 노드, 네임스페이스(Namespace), 배포, 컨테이너 이름 등을 기준으로 그룹화해 컨테이너맵을 확인할 수 있다. 이를 한눈에 볼 수 있는 퀵 옵저베이션(Quick Observation)부터 세분화 옵저베이션은 와탭만 제공할 수 있는 기술력이다. 이 외에도 고객은 와탭 모니터링 서비스의 공통 기능으로서 인공지능(AI) 및 머신러닝(ML)으로 데이터 패턴을 시각화한 수많은 히트맵 패턴을 학습해 이상 징후에 대한 실시간 알림 및 보고서를 받을 수 있다.

올해 와탭랩스는 와탭 옵저버빌리티 플랫폼을 토대로 다양한 산업군 및 글로벌 시장을 목표로 공격적인 비즈니스를 전개한다는 계획이다. 와탭랩스는 조달청 디지털서비스몰에 와탭 플랫폼을 등록함으로써 공공시장 진출에 적극적으로 뛰어든다는 방침이다. 아울러 글로벌 시장 진출도 꾀한다. 현재 와탭랩스는 일본을 비롯해 인도네시아 등을 포함하는 동남아시아 시장에 진출하고 있으며, 미국 시장 진출도 준비 중이다.

[인터뷰] “AI 및 ML 엔진 적용해 시간대별 성능지표 및 탐지 가능”
와탭랩스 김성조 CTO
와탭랩스 김성조 CTO

와탭랩스는 와탭 옵저버빌리티 플랫폼에 인공지능(AI) 및 머신러닝(ML) 엔진을 적용했다. 시간대별 성능 지표 변동 폭 정보에 대해 학습하고 최대 8시간의 데이터를 예측할 수 있어 서비스 이상 징후를 미리 탐지할 수 있다.

특히 와탭랩스가 특허출원한 히트맵 패턴 분석은 응답시간 분포도를 통해 종료된 트랜잭션의 상태를 체크하고 장애 시 히트맵의 특정 패턴으로 사전에 장애를 감지하고 분석할 수 있고 실시간 알림을 통해 서비스 안정성과 운영 효율성을 극대화한다.

아울러 와탭랩스는 다양한 데이터를 학습해 정상 패턴과 비정상적인 활동을 구분하는 머신러닝 기반 모델도 적용하고 있다. 이러한 모델은 네트워크, 서버, DB 등의 데이터를 분석해 이상 징후를 실시간으로 탐지하고, 디도스 공격이나 데이터 유출과 같은 위협 요소를 빠르게 식별할 수 있도록 돕는다. 이를 통해 비즈니스 연속성을 보장하고, 장애 발생 시간을 최소화하는 데 기여한다. 와탭랩스는 AI/ML을 옵저버빌리티 플랫폼에 접목할 수 있는 다양한 기술도 준비 중으로, 지속적인 고도화에 나서고 있다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지