머큐리인터액티브 _ NHN

NHN은 지난 91년 포탈사이트 네이버로 출발해 한게임과 합병하면서 1999년 6월 설립됐다. 총 직원수는 한·중·일 모두 합해 1,200명에 달하며 연간 매출은 2,600억원으로 명실공히 국내 최고의 인터넷 서비스 기업이다.
회사 설립 초기, NHN은 다른 인터넷서비스 회사들처럼 초고속 성장을 구가하며 안정이나 품질보다는 빠른 서비스 개통과 확장에 주력했다. 그러나 최근 1,2년 전부터 성장 곡선이 안정되면서 자연스레 대소비자 서비스와 안정성, 서비스 품질이 주요 이슈로 떠올랐고 경쟁사들보다 먼저 체계적인 품질 관리를 위해 큰 로드맵을 그리게 됐다. NHN은 이 때 최종 소비자인 네이버·한게임 사용자에게 내용뿐 아니라 안정성과 속도면에서도 '최고의 품질'을 제공하는 것을 가장 큰 목표로 설정했고 이를 위해 SLA를 도입하기로 결정했다.
성공적인 SLA도입을 위해 머큐리인터액티브의 BA센터를 선택한 NHN은 한국IBM과 IT아웃소싱 계약을 맺으며 서비스를 새롭게 정의했다. 특히 NHN은 서버 가동률이 99%에 이른다 해도 1% 때문에 네이버 사용자가 검색 결과를 늦게 열어보거나 로그인이 안 된다면 서비스품질이 떨어진다고 판단하고 사용자가 체감하는 만족도를 높이겠다는 취지로 기존의 SLA보다 강도 높은 서비스 수준을 요구했다. 또한 NHN은 머큐리인터액티브의 BA센터를 통해 실시간 스크린샷으로 서비스 상황을 확인하고 더욱 빠른 모니터링 및 장애 파악과 복구로 소비자가 만족할 수 있는 서비스를 제공하고자 했다.

서비스 관점의 SLA도입
NHN은 먼저 SLA에서 500개 이상의 서비스를 대상으로 핵심성과지표(KPI)를 수치화해 만들었다. 게임의 경우 300트랜잭션이 있는데 이를 관리하기 위해 전부 코드화했다. 내부 SLA를 실현하기 위해 각 부서에 서비스 가용성 99%를 달성하라는 목표를 제시했다. 기존의 SLA는 서버 가용률을 몇 %로 유지할 것인가가 주요 내용이라면 NHN의 SLA는 자사 서비스가 중심이 된다. 네이버 첫 페이지와 연결된 서버가 100대인데 그 가운데 10대가 죽어도 서비스가 살아있을 수 있다. 서버 가용률이 90%라고 해서 SLA 점수를 깎는다는 것은 합리적이지 못하다는 것이다. 또한 NHN은 웹, 애플리케이션, 데이터베이스 등을 애플리케이션으로, 서버를 인프라로 정의했다. NHN은 인프라 위주의 관리가 아니라 서비스 중심의 관리이기 때문에 사용자가 네이버 첫 페이지를 클릭하는 것은 서비스라고 하지만 그 아래 소비자가 모르는 것은 서비스가 아니라고 정의했다.
NHN은 SLA에서 서비스별로 가중치가 두고 있다. 이 점수를 다 더하면 100으로 해 사업부가 편리하게 관리하도록 했다. 예를 들어 A서비스의 점수가 99.5가 나왔는데 여기에 가중치 60%를 부여하고 B서비스 99.9에 가중치 40%를 부여해 점수를 내는 것이다. 서비스별 가중치는 가변적인 것으로 IT부서, 해당 사업부가 상의해 가중치를 조정할 수 있다.
이러한 노력의 결과로 NHN은 각종 인터넷 서비스 지표 조사에서 선두의 자리를 확고히 할수 있었다. 현재 네이버는 1일 5억 페이지뷰를, 한게임은 1일 20만 동시접속자를 기록하고 있다. SAL 관리의 핵심 가운데 하나는 바로 '서비스 코드' 관리이다. NHN은 새로 추가되는 게임이나 서비스는 빈틈없이 서비스 코드 관리 시스템에 감지되고 서비스 코드에 등록되는 순간 바로 SLA에 등록되는 체계를 구축했다.
NHN은 머큐리 BA센터 도입을 통해 서비스의 안정성과 확실한 가시성을 확보했으며 장애가 발생했을 때 그것을 복구하는 수준을 한 차원 높이게 됐다. 아울러 실시간 스크린샷으로 서비스 상황을 확인하기 때문에 장애가 나면 바로 알 수 있고 신속하게 처리할 수 있게 됐다. NHN은 또 속도와 안정성에 있어 확실한 가시성을 확보함으로써 초기에 많은 장애를 찾아내 고칠 수 있게 됐으며 장애 원인을 신속하게 찾아 개선하다 보니 서비스 수준이 자연스럽게 높아졌으며 고객은 NHN의 서비스에 크게 만족했다.
현재 NHN은 머큐리 BA센터를 통해 일반 엔지니어와 CIO가 같은 화면을 보면서 서비스 상황을 실시간으로 확인하고 이해할 수 있다. NHN은 IT인프라가 아닌 서비스 중심이기 때문에 사업부 담당자가 화면을 봐도 현재 서비스, 응답속도, 처리속도 등에 문제가 있는지에 대해서도 확인할 수 있는 머큐리의 솔루션은 최적의 솔루션이라 할 수 있다.
저작권자 © 아이티데일리 무단전재 및 재배포 금지