10.23
뉴스홈 > 칼럼
차세대 데이터보호 기술 ‘데이터중복제거ㆍCDPㆍBMR’데이터의 체계적 저장ㆍ효율적 관리ㆍ안전한 보호의 해결책


옥선미/한국EMC 차장


IDC가 최근 내놓은 전세계 디지털 정보 성장 전망 보고서에 따르면, 2007년 전세계적으로 생산, 유통된 디지털 정보량은 281엑사바이트(Exabyte: EB / 1EB=10억 7천 기가바이트)로, 2006년 대비 57%나 증가한 것으로 나타났다. 디지털 정보는 연평균 60%의 고 성장률을 지속하며 2011년에는 전세계적으로 2006년 대비 무려 10배나 증가한 1.8 제타바이트(Zettabyte)를 기록할 것으로 예측되었다. 그야말로 디지털 정보의 '빅뱅' 시대가 도래한 것이다.

기업 입장에서 이와 같은 디지털 정보의 무한 성장은 정보 관리에 대한 새로운 시각을 요구하고 있다. 즉, 무수히 많은 데이터를 얼마나 체계적으로 저장하고, 효율적으로 관리하며, 안전하게 보호하느냐 하는 것이 기업들이 고심하고 있는 문제이다.

기업들이 데이터 보호와 관련해 직면하고 있는 문제들을 살펴보면, 첫째, 급증하는 데이터로 백업 시간과 소요 비용이 늘어나고 있다. 둘째, 분산 환경의 확산으로 원격지 데이터는 늘고 있는 반면 보호체제는 부족하다. 셋째, 백업 미디어로 많이 사용하는 테이프가 경제성은 뛰어나나 성능과 신뢰성이 상대적으로 부족하다. 마지막으로, 가상화 등 컴퓨팅 환경의 고도화로 백업 작업에 어려움이 가중되고 있다. 일례로, 미국의 경우, 기업의 75%가 데이터 소실(data loss)을 경험하고 있는 것으로 조사돼 체계적인 정보 관리와 보호가 그 어느 때보다도 중요한 IT 과제로 부각되고 있다.

이 가운데 정보를 안전하게 보호하기 위한 데이터 백업 시장은 기업의 데이터 보호 요구와 맞물려 성장 가도를 달리고 있다. IDC에 따르면, 전세계 데이터 보호 및 복구 소프트웨어 시장은 2005년도 26억 달러에서 연평균 6.6%의 성장을 거듭하며 2010년까지 36억 달러 규모로 확대될 것으로 예상되고 있다. 이 가운데, 백업 분야의 신기술로 주목받고 있는 데이터 중복 제거 기술 관련 시장은 2007년 전세계 기준 2억6천만 달러 규모에서 2009년 10억 달러까지 성장할 것으로 전망된다. 특히, 데이터 중복제거 기술을 탑재한 스토리지 시장은 연평균 108%의 고성장을 지속하며, 2010년에 16억 달러 규모에 이를 전망이다.

이 기고에서는 차세대 데이터 보호 기술로 주목받고 있는 ▲데이터 중복제거 ▲CDP(지속적데이터보호) 기술 ▲BMR(베어메탈리커버리) 등을 살펴본다.

1. 백업 비용과 성능 문제의 해결사 '데이터 중복 제거'
기존 백업 솔루션은 전 세계 수천 대의 서버, 데스크톱, 노트북, 지사 등에 분산되어 있는 중복 데이터 파일과 서브 파일 데이터 세그먼트 등 불필요한 데이터까지 모두 백업한다는 점에서 매우 비효율적이었다.

데이터 중복 제거 기술 기반의 차세대 백업 솔루션은 바로 이러한 기존의 백업 환경에서 해결하기 어려웠던 문제들, 즉, 백업 용량을 근원적으로 줄일 수 있는 방안과 이와 관련된 운영 효율성을 극대화시키는 데 중요한 기술을 제공한다. 지난 몇 년간 등장한 데이터 중복 제거 기술 대부분은 백업이 이루어지고 난 후 백업 미디어 단에서 중복을 제거하는 방식을 취하고 있다. 그러나 분산/원격 환경에서는 백업 미디어에 저장되는 용량뿐만 아니라, 대용량의 데이터를 제한된 네트워크 환경에서 백업/복구하는데 소요되는 시간과 대역폭이 이슈가 된다.

반면, 클라이언트 단에서 효과적으로 데이터 중복 제거 기술을 이용하게 되면 백업 미디어 단으로 이동하기 전에 데이터 량을 몇 백 분의 1로 줄일 수 있기 때문에 적은 대역폭을 가진 네트워크 구간에서도 신속한 백업 및 복구를 지원하며, 멀리 떨어진 원격 지사 환경에서 더욱 큰 효과를 발휘할 수 있다.

특히, 글로벌 데이터 중복 제거 기술은 단일 클라이언트에 존재하는 데이터뿐만 아니라, 전 세계 각지에 분산되어 있는 서버와 데스크톱, 노트북, 지사에서 중복되는 모든 서브 파일 및 데이터 세그먼트를 식별하여 단 한번만 저장을 하기 때문에 중복 제거의 효율성을 높여준다. 글로벌 데이터 중복 제거 기술은 거리 및 분산 여부에 상관없이 효율적인 백업 성능과 용량 절감 기능을 제공하는 셈이다.

데이터 백업의 혁신을 가져올 데이터 중복 제거 솔루션은 특히 다음과 같은 환경에서 그 효과가 극대화될 것으로 기대된다.

(1) WAN 기반의 원격 지사 및 지점 환경
원격 지사에는 표준화된 백업 인프라 및 숙련도를 갖춘 IT 인력이 부재한 경우가 대부분이다. 재해 복구를 위해 테이프를 직접 외부로 수송하거나 원격지 네트워크로 데이터를 이동하더라도 암호화 환경의 부재로 데이터 손실 및 유출의 위험에 노출되어 있는 경우가 빈번하다. 데이터 중복 제거 기술은 네트워크 전송 이전에 전사적으로 중복된 데이터에 대해 단일 세그먼트만 저장함으로써 WAN과 같이 네트워크 대역폭이 제한된 환경에서 백업작업의 효율성을 높여준다. 또한 원격 지사에서 관리해야 하는 로컬 테이프 드라이브, 미디어 서버 등의 관리 작업을 최소화하고 테이프 분실이나 도난의 위험도 크게 줄일 수 있다.

(2) 네트워크 기반에 분산된 서버/PC 환경
수십 대 이상의 서버를 운영하는 데이터 센터는 대부분 분산 환경에서 백업을 운영하는 데 어려움을 호소하고 있다. 또, 기업 정책이나 규정 이슈로 임직원들의 PC 백업 의무화가 요구되는 환경에서 효과적인 백업 및 관리 방안을 찾는 것이 쉽지 않다. 이들 환경의 공통점은 유사한 운영체제와 중복된 데이터들을 많이 보유하고 있을 뿐만 아니라 네트워크 기반 백업이 유일한 환경에서 사실상 백업 성능의 향상이 매우 어렵고, 분산된 인프라를 관리하는데 어려움을 안고 있다는 것이다. 소스 단에서 이루어지는 데이터 중복 제거 기술은 이러한 환경에서 효과적으로 중복성을 제거하고 네트워크 간 데이터 이동 효율성을 높이며, 중앙 통합 관리로 효과적인 데이터 센터 백업을 구현할 수 있다.

(3) VM웨어(VMware) 환경
VM웨어와 같은 서버 가상화 솔루션은 컴퓨팅 환경에서 빠르게 성장하는 분야 중 하나지만, 백업의 관점에서는 물리적 자원과 다른 가상 자원의 존재로 백업 작업의 복잡성을 가중시키기도 한다. 각 가상 시스템에서는 전체 및 증가분 백업을 위해 매주 약 200%의 데이터가 전송되며, 각 물리적 서버에 다수의 가상 시스템이 구축되어 동일한 물리적 자원을 공유하기 때문에, 메모리와 CPU 사이클 등을 두고 경쟁, 백업 성능에 많은 제약이 따른다. 또 이와 같은 물리적 서버에 구축된 여러 가상 서버의 애플리케이션들이 동일 시간에 백업을 요구할 경우 백업 성능은 더욱 문제가 될 수 있다.

데이터 중복 제거 기술을 이용해 소스에 구축된 가상 시스템 내의 중복된 백업 데이터를 삭제하게 되면 백업되는 데이터의 양이 대폭 줄어 하드웨어 자원에 대한 부담도 감소하며, 그 결과 가상 시스템 환경의 백업 속도를 획기적으로 높일 수 있다. 실제 테스트 결과, VM웨어 환경에서 데이터 중복 제거 기술을 사용할 경우 전송 데이터는 최대 95%, 백업 시간은 최대 90%까지 단축시키는 성과를 거두었다.

2. 원하는 시점으로 신속한 복구 기술 'CDP'
고객들의 백업 환경이 데이터 마이그레이션과 복제를 용이하게 하는 '차세대 인텔리전스 백업 환경'으로 전환되고 있는 가운데, 원하는 시점으로 신속한 복구를 가능하게 하는 CDP(Continuous Data Protection: 지속적데이터보호)도 주목을 받고 있다.

기존에는 정해진 스케줄에 따라 특정 시점의 이미지(Point-In-Time copies)를 백업하는 방법이 주로 사용되었다. 이 경우 백업 직후 복구가 필요한 경우라면 다행이지만, 백업 후 다음 백업 스케줄 시점 바로 전에 문제가 발생하면 백업 시간의 간격에 따라 적지 않은 복구 시간과 노력이 수반된다. CDP는 연속적인 백업, 원하는 시점으로의 복구를 위해 개발된 차세대 백업 솔루션이다.

CDP는 파일이나 블록(Block) 레벨에서의 데이터 변경을 모두 캡처하여 모든 데이터 상태를 기록관리(Journaling)하고 있다가 필요시에 원하는 시점의 이미지를 복구하도록 지원한다. 즉, 특정 시점의 백업 이미지에 원하는 시점으로의 복구를 위해 로그를 적용하는 '롤링 포워드(Rolling Forward)' 프로세스와 같은 복잡한 절차를 거치지 않고 다수 애플리케이션에 대한 여러 복구 이미지를 시간적으로 누적 관리하여, 원하는 시점의 복구이미지를 제공한다는 것이다.

CDP는 백업 대상의 모든 변경사항들을 캡처(capture)하고 보관하고 있다가 원하는 과거 어느 시점의 이미지로도 복구가 가능해 복원에 걸리는 시간이 적게 걸리고 복구 지점도 유연하게 지정할 수 있다는 이점이 있다. 이처럼 유연한 'Any-Point-In-Time' 아키텍처는 미션 크리티컬(Mission-Critical)한 데이터베이스나 데이터베이스와 연계한 애플리케이션의 복구에 적합하다.

일례로, 데이터베이스관리자는 애플리케이션 손상(Corruption)이나 장애 발생 시 해당 시점에서 1초 전으로 시간을 설정하고 복구에 필요한 대상만 설정하면 된다. 더 이상 과거 시점의 백업본과 아카이브 로그를 이용해 원하는 시점으로 복구작업을 수행하지 않아도 된다. 이러한 손쉬운 복구작업으로 시간 및 비용 절감, 관리효율성 측면에서 매우 큰 효과를 거둘 수 있다.

한편, CDP 솔루션은 전통적인 백업 및 복구 인프라스트럭처를 완전히 대체하는 개념이 아닌, 서비스 측면에서 더욱 상위의 서비스 수준이 요구되는 환경을 지원하기 위해 개발된 기술이란 점을 주지할 필요가 있다. 또, IT 운영담당자 입장에서는 기존 투자 환경을 보호하면서, 좀더 높은 서비스 수준을 요구하는 경우에 적용 가능한 기술이라 할 수 있다.

* CDP 솔루션 도입시 효과가 높은 고객
▸ WAN, 전송 장비 투자비용 부담으로 DR을 구축하지 못하는 고객(스토리지 기반 복제는 고 대역의 네트워크 환경이 필요)
▸ 하드웨어, 소프트웨어, 운영 등 모든 장애에 대한 완벽한 복구 체제 구축을 희망하는 고객
▸ 이기종, 멀티 벤더 스토리지에 대한 센터 내 통합 백업 및 원격 통합 DR 구현으로 스토리지 투자 절감을 구현하고자 하는 고객
▸ SQL, Exchange 환경에서 100% 데이터 정합성이 보장되는 저투자, 고품질 스토리지 복제를 요구하는 고객
▸ 프로덕션의 다양한 시점 이미지를 활용해 효율적 애플리케이션 개발, 테스트로 시장변화에 신속한 대응을 추구하는 고객

3. 복잡한 OS 복구의 대안 '베어 메탈 리커버리'
대부분의 기업들이 자동화된 시스템을 통해 데이터 백업을 정기적으로 수행하고 있지만 OS 구성정보에 대한 보호는 잘 이루어지고 있지 않다. 일반적으로 사용되는 개별 OS 백업은 ▲수동 백업으로 인한 최신 OS 백업 데이터 유지의 어려움 ▲관리자의 작업 부담 증가 ▲OS별로 상이한 백업 및 복구 방법으로 일관된 데이터 보호 정책 적용의 어려움 ▲사내 백업 솔루션과의 통합 부재로 인한 데이터의 중복 백업 초래 등의 문제점을 가지고 있다. 과거 개별 서버 백업의 어려움을 겪었던 기업들이 이를 극복하고자 통합 백업으로 눈을 돌린 이유가 이 때문이다.

이러한 이유로 자동화된 OS 복구 방식이 필요하게 되었고, 이것이 바로 '베어 메탈 리커버리(Bare Metal Recovery: BMR)'다. 일반적인 OS 복구를 수행할 때 OS나 애플리케이션이 설치되지 않은 서버에서 백업 서버에 네트워크를 통해 접속한 후 애플리케션을 복구하고 원래의 애플리케이션 환경을 그대로 똑같이, 자동으로 복구하는 방식을 BMR이라고 하다.

이 방법은 대부분의 절차가 관리자가 개입하지 않은 상태로 진행되고, OS에 상관없는 동일한 복구 절차를 통해 수행되므로 관련된 모든 OS에 대한 지식이 부족한 관리자라도 복구를 수행할 수 있다는 것이 이점이다. 특히, 복구의 핵심인 애플리케이션을 별도의 설치나 구성 절차 없이 장애 전 백업 상태로 복구할 수 있다는 점이 BMR의 차별점이라고 할 수 있다. BMR은 서버 장애시 OS 복구 작업의 간소화로 서비스 중단을 최소화함으로써 기존의 복잡한 OS 복구의 어려움을 해결해줄 것으로 보인다.

BMR의 방식은 특징에 따라 크게 '이미지 방식'과 '프로파일 방식'으로 분류할 수 있다. '이미지 방식'은 OS의 구성이 아닌 디스크 드라이브의 이미지를 백업하는 것으로 기능이 간단한 것이 특징이다. 그러나, 이 방식은 지원 백업 장비가 제한적이고, 대부분의 이미지 백업 솔루션의 경우 디스크만 지원하는 단점이 있다. 또, 많은 양의 백업 장비가 필요하며, 기존 백업 인프라와 통합이 되지 않아 이중 백업의 이슈가 있다. 이밖에도 하드웨어 사양이 틀린 이기종 서버에 대한 복구가 지원되지 않고, 전사적인 백업 정책 적용이 어렵다.

반면, OS의 구성 정보만을 백업하는 '프로파일 방식'은 복구에 필요한 정보를 암호화 및 압축해 적은 양만 백업한다. 프로파일 방식은 백업 시스템과 통합되어 관리되며, 통합 백업 장비를 사용하기 때문에 OS를 위한 별도의 백업 장비가 필요 없다. 또, 하드웨어 사양이 틀린 이기종 서버에 대한 복구를 지원하고, 전사적인 백업 정책 적용이 가능하다. 특히, 적은 양의 OS 구성 정보를 저장하기 때문에 재해 복구를 위해 WAN 통신망을 이용한 복제 구성이 가능하고 적은 양의 서버 구성 정보만으로도 복구가 가능한 이점이 있다.

차세대 통합백업 솔루션의 부상
차세대 백업 솔루션은 백업, 복구 및 아카이빙 작업을 별개의 프로세스가 아닌, 상호 보완을 통해 기업의 IT 및 기업활동을 향상시키는 연관된 프로세스로 간주한다. 이러한 유기적인 접근방식을 통해 전 IT인프라에 걸친 정보 보호는 물론, 비용 절감과 효과를 극대화하는 것이 차세대 통합 백업 솔루션 전략의 목표이다.

지난 해 EMC는 EMC 아바마(Avamar) 데이터 중복제거 기술과 EMC 리커버포인트(RecoverPoint) CDP 기능이 통합된 'EMC 네트워커(EMC NetWorker)' 백업 솔루션을 발표하는 등 이와 같은 통합적 백업 접근은 더욱 가속화될 전망이다. 특히, 폭발적으로 증가하는 기업 데이터의 효율적인 데이터보호와 TCO(총소유비용) 절감에 대한 요구가 증가하면서 차세대 통합 백업 솔루션은 전통적인 백업 방식의 불편함을 해소하고, 고성능과 신뢰성을 보장하는 데이터 보호 환경을 마련해 줄 것이다.

인기기사 순위
(우)08503 서울특별시 금천구 가산디지털1로 181 (가산 W CENTER) 1713~1715호
TEL : 02-2039-6160  FAX : 02-2039-6163  사업자등록번호:106-86-40304
개인정보/청소년보호책임자:김선오  등록번호:서울 아 00418  등록일자:2007.08  발행인:김용석  편집인:김선오