고가용성 및 재해 복구 소프트웨어 도입해 비용 효율적인 백업 데이터 센터 구축해야






재해 복구 센터는 오랜 기간 엔터프라이즈 컴퓨팅에서 필수 요소로 여겨졌다. 허리케인 카트리나와 같은 최근 발생한 자연재해로 인해 IT 관리자들은 메인 및 백업용 IT 설비 손상의 심각성을 인식하게 됐다.

이로 인해 비즈니스 연속성을 위한 포괄적인 계획 수립의 중요성이 부각됐는데 이 같은 계획에는 메인 데이터 센터에 발생한 재해가 영향을 미치지 않을 정도의 원격지에 재해 복구 센터를 구축하는 것 역시 포함돼 있다. 그러나 대기업을 제외한 대부분의 기업이 현실적으로 비용 문제로 인해 재해 복구 센터를 설립하지 못하는 실정이다.

따라서 각종 재해 발생 시에도 비즈니스 연속성을 확보할 수 있는 비용효율적인 방안들이 새로이 소개되고 있다. 새로운 재난 복구 전략은 주 센터의 고가용성 솔루션의 확장으로 구성되며, 대부분의 관리자가 재난 복구 계획 수립 시 간과하기 쉬운 다운타임의 원인 역시 파악해 해결할 수 있다. 또한 구성 관리, 클러스터링, 서버 가상화를 위한 자동화 솔루션은 재해 복구 센터 구축 및 운영을 한층 비용 효율적으로 만들 뿐만 아니라 다운타임을 최소화해주므로 IT 관리자는 엄격한 시스템 가용성 요구를 준수할 수 있다.

특히 기업의 IT 조직은 다음에 소개되는 다섯 가지 방안을 통해 바람직한 재해 복구 전략을 수립할 수 있을 뿐 아니라 일상적인 시스템의 가용성 역시 최대화할 수 있다.

#1. 즉각적인 문제 확인
과거에 재해 복구가 적시에 시행되지 않은 이유 중 하나는 문제 발생과 진단을 IT 관리자에게 알리는 경고 프로세스가 신속하게 이뤄지지 않았기 때문이다. 그러나 향상된 클러스터링 기술이 제공하는 통지 및 리포팅 기능은 문제가 발생한 시점을 정확히 파악하고 이를 IT 관리자에게 즉시 알린다. 클러스터링 기술은 재해 복구 센터의 애플리케이션을 가동시켜 사용자를 재해 복구 센터로 연결함으로써 즉각적인 조치를 취할 수 있게 해준다.

#2. 자동화를 통한 다운타임 감소
많은 기업이 시스템 복구 작업을 수동으로 실행하고 있는데, 수작업은 문제 확인 및 해결에 많은 시간이 오래 소요된다. 반면 고가용성 클러스터링을 사용한 자동화된 접근 방식은 전통적인 수동 복구 프로세스에 비해 다운타임을 현저하게 감소시켜 준다.

클러스터링 소프트웨어는 메인 데이터 센터의 시스템에 장애가 발생한 경우 재해 복구 센터 서버의 애플리케이션을 자동으로 재 구동시키며 그 외 비즈니스 연속성을 유지하기 위해 필요한 일련의 작업들을 수행한다. 문자 메시지나 이메일을 통해 관련 내용을 통지하는 기능도 지원되므로 IT 관리자는 언제나 문제에 대한 가시성을 확보할 수 있고, 직접 처리해야 할 일은 최소화하게 된다.

자동화된 방식은 재해로 인해 데이터 센터 전체가 가동되지 않는 장애 상황에서, 수작업 조작 실수를 배제하고, 다운 타임을 줄이는 자동화된 방법으로 핵심 애플리케이션을 재해 복구 센터에서 운영되도록 한다. 일단 페일오버 솔루션이 복제된 데이터를 가진, 지속적 운영이 필요한 애플리케이션을 결정하게 되면, 한번의 클릭을 통해 자동으로 애플리케이션을 재 구동시키고 사용자를 재해 복구 센터로 연결할 수 있게 된다.

이 외에도 자동화된 페일오버는 대부분의 재해 복구 계획이 공통적으로 갖고 있는 약점, 즉 재해 발생 시 항상 IT 담당자가 데이터 센터에서 수동으로 애플리케이션을 재 시동시킬 수 있는 상태여야 한다는 전제 조건이 갖는 문제 역시 해결해 준다. 수동 복구 방식에 의존하는 경우 IT 담당자의 부재는 곧 비즈니스 연속성을 해치게 되는데 자동화는 이런 잠재적 시스템 장애 요인을 제거한다.

#3. 재해 복구 센터를 활용한 유연성 확보
대부분 IT 조직은 재해 복구 센터를 평소 아무 역할 없이 비용만 소요하는 존재로 여긴다. 그러나 서버 프로비저닝 소프트웨어의 향상으로 인해 테스트 진행 또는 품질 보증 테스트, 중요도가 낮은 애플리케이션 운영과 같은 목적으로 재해 복구 센터를 활용할 수 있게 됨으로써 재해 복구 센터는 또다른 가치를 제공하고 있다.

뿐만 아니라 향상된 클러스터링 소프트웨어를 통해 기존의 방식이 프로덕션 애플리케이션이 실행되는 하드웨어와 동일한 기종으로의 페일오버만 지원함으로써 야기되는 고비용 문제를 해결할 수 있는데, 가장 정교한 클러스터링 소프트웨어의 경우 데이터 센터 내에서 또는 원격지에서 이기종 스토리지 및 서버 하드웨어간의 페일오버를 지원하기 때문이다.

재해 복구 센터는 동적 재구성 및 리소스 재할당이 가능한 유연성을 갖춤으로써 평소에는 다용도로, 재해 발생 시에는 신속하게 본래 백업 용도로 사용이 가능한 전천후 리소스로 변모하고 있다. 이런 변화는 백업 데이터 센터가 제공하는 가치를 부각시키게 됨으로써 더 많은 기업이 재해 복구 센터 설립을 고려하기에 이르렀다.

#4. 가상 환경에서 가능한 가치 실현
서버 가상화는 오늘날 서버 중심의 데이터 센터 분야에서 주요 기술로 대두돼 왔다. 서버 가상화는 단일 서버 상의 개별 운영체제에서 독립적으로 실행되는 다수의 운영체제를 실행할 수 있는 가상 머신 기술을 바탕으로 한다.

이제까지 재해 복구 센터에서 가상 서버를 재 구동시키기 위해서는 수동 프로세스를 거쳐야 했는데 이 같은 방식은 실제 재해 발생 시 IT 담당자가 작업이 불가능한 경우 심각한 문제를 야기한다. 그러나 최근 등장하고 있는 클러스터링 소프트웨어는 기업이 서버 가상화 기술을 적용하고, 가상 환경에서도 물리적 서버 환경에서와 마찬가지로 자동화된 재해 복구를 실행할 수 있도록 해준다.

더욱이 새로운 고가용성 및 재해 복구 툴을 이용하면 복잡한 물리적 및 가상 서버 환경의 보호, 관리를 한층 단순화시킬 수 있다. IT 관리자들은 클러스터링 소프트웨어를 이용해 물리적 서버에서 가상 서버로의 애플리케이션 페일오버 또한 지원할 수 있으며 단일 GUI를 통해 물리적 및 가상 자원을 관리할 수 있다. 즉, 물리적 및 가상 서버를 효율적으로 관리함으로써 재해 복구 센터에서 소요되는 하드웨어 비용를 현저히 감소시킬 수 있다.

#5. 정기적인 재해 복구 계획 테스트 실시
최근 조사에 따르면 정기적으로 재해 복구 계획을 테스트하는 기업은 소수에 불과하며 대부분 기업은 재해 복구 계획을 실제 실행했을 때 효과가 있으리라는 확신이 없는 것으로 나타났다. 기업이 재해 복구 테스트 실시에 소극적인 이유는 테스트로 인해 종종 프로덕션 시스템에 장애가 발생하기 때문이다. 시스템 장애로 말미암아 다수의 관련 인력이 보다 중요한 프로젝트를 잠시 중단하고 문제 해결을 위해 동원되며 이로 인해 주말이나 야간에 근무해야 하는 상황이 생기게 된다.

그러나 이제 IT 조직은 자동화된 페일오버 기능을 도입, 프로덕션 데이터의 복사본을 이용해 복구 과정을 테스트할 수 있다. 또한 해당 과정에서 프로덕션 과정의 일시적 중단, 데이터 손상 또는 프로덕션 애플리케이션의 재시동과 관련된 문제 발생의 위험 역시 걱정할 필요가 없다. 즉, 주말 대신 업무 시간 내에 테스트를 실시함으로써 IT 담당자의 초과 근무를 줄일 수 있으며 가장 활발한 프로덕션 주기에 자동화된 테스트를 실시하는 것은 물론 실제 페일오버 상황과 유사하도록 조건을 재설정하는 것 역시 가능하다.

또한 IT 관리자들은 구성 관리 툴을 통해 재해 복구 센터와 메인 데이터 센터의 서버 구성의 일치성을 확신함으로써, 재해 복구 계획의 실효성에 대해 자신감을 가질 수도 있다.

서버는 초기 구성에서 시간이 지남에 따라 패치가 적용되거나 애플리케이션 간의 연관 관계가 변경되는데, 대기(stand-by) 서버에 항상 최신 패치 또는 구성 업데이트가 실시간으로 이루어지지는 못한다. 이로 인해, 클러스터 서버가 제대로 작동하지 않을 수 있는데, 이런 경우 최신 구성 관리 툴을 이용해 메인 데이터 센터와 복구 센터 서버의 일치 상태를 점검하고 표준에서 벗어난 서버는 IT 관리자에게 알릴 수 있다. 그 후 구성 관리 툴은 서버를 일치시키고 필요한 경우 고가용성/재해 복구 기술이 확실히 적용되도록 필요한 조치를 취한다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지