체증 걸린 백업 및 복구관리…효과적인 복구 관리로 말끔히 해결






기술의 발전과 지속적인 투자에도 불구하고, 데이터 관리는 여전히 비용 상승, 시간 낭비 등 풀지 못한 많은 과제를 안고 있다. 정부 규제와 비즈니스 필요 조건, 조직 내부 감사 등의 증가로 위험부담은 커지고, 전통적인 데이터 관리 방식은 더 이상 효력을 발휘하지 못하고 있다.

본 청사진에서는 먼저 다단계 스토리지 시스템과 결합된 스냅샷, 복제, 아카이빙 기술이 어떻게 데이터 관리를 진화시키는지 살펴본다. 이어 B2D(Backup-to-Disk) 전략을 넘어서 RPO/RTO(Recovery Point Objective/Recovery Time Objective)의 서비스 수준을 높이는 방안을 제시, 이용자들의 데이터 사용 능력을 배가시키고자 한다. 특히 데이터 보호에 복구 관리 기능을 추가했을 때 유용한 것들을 중점 소개한다.

1.복구 관리의 새로운 해결책 등장
너무 많거나 기하급수적으로 증가하는 데이터, 다양한 애플리케이션 등이 많지만, 그것들을 일일이 모두 백업하고 복구할 시간이 턱없이 부족하다는 것을 뼈저리게 느끼고 있는 IT 관리자들도 상당수 있을 것이다. 복구 관리는 이런 문제 해결을 위해 데이터의 양에 상관없이 사용자가 원하는 만큼의 데이터를 보호할 수 있도록 하고, 필요할 때 데이터를 즉각적으로 복구할 수 있는 기능을 제공하는 새로운 해결책을 제공하고 있다.

복구관리의 새로운 해결책이 이메일 애플리케이션과 데이터베이스에서 차지하는 의미에 대해 한 번 생각해보자. 데이터 손상과 바이러스 공격 등으로 인해 비즈니스 시스템은 불과 몇 초 만에 다운될 수 있다. 이를 비즈니스 연속선상에서 생각해보면, 보다 나은 분석과 의사결정, 실행 그리고 경쟁력 강화를 위해 데이터와 정보에 대한 지속적인 액세스는 반드시 필요하다.

복구 관리는 계속 반복되는 구시대적인 이야기처럼 들릴 수도 있다. 백업이 복구만큼 중요하다는 것. 이것은 절대 구시대적인 이야기가 아니다. 한마디로 복구 관리는 제조 데이터를 온라인으로 복제하고 관리하는 일이다. 복제 데이터가 온라인상에 있으면, 길고 긴 복구 프로세스를 거칠 필요 없이 즉시 이용이 가능하다.

이것은 백업 사본 이용을 위해 복구 절차를 거친 후에야 이용이 가능했던 백업 혹은 B2D(Backup-to-Disk)의 극적인 변화라고 할 수 있다. 데이터베이스의 크기에 따라, 익스체인지나 오라클의 복구 절차는 수 일이 걸리는 것이 다반사이다. 게다가, 복구절차가 진행되는 동안 엔드유저들은 이메일은 물론이고, 프로세스 주문도 할 수 없다. 결국 비즈니스는 진행속도가 지체되고 심한 경우에는 중단까지도 가능하다.

스냅샷과 복제 기술을 포함해 온라인 복제본을 생성하는 기술은 분명 과거에도 존재했었다. 그렇다면 무엇이 달라진 것일까? 우선, 이 기술들의 보다 광범위한 이용이 가능해졌다는 점이다. 과거에 이 기능들은 가장 크고 가장 비싼 스토리지에서만 이용 가능했었다. 이제 HDS, 넷앱, EMC, HP, Engenio, IBM, LeftHand, Xiotech 등 많은 스토리지 제조사들은 이 기능들이 내장된 중간 단계 스토리지들을 내놓고 있다. 이들 중 일부는 API 기능을 추가해 임베디드 스냅샷과 복제 기능을 가진 소프트웨어 관리까지도 가능하게 하고 있다. 또 일부는 동일한 목적으로 마이크로소프트 볼륨 쉐도우 카피 서비스(VSS) 표준까지 지원하고 있다. 델과 같은 유통사들도 엔트리-레벨 장비를 포함해 이와 같은 광범위한 장비들을 제공하고 있다.

이와 마찬가지로, 이 기능들을 관리하고 온라인 복제본을 생성, 활용하는데 필요한 소프트웨어도 이용 가능하게 되었다. 컴볼트는 현재 온라인 복제본을 간편하고 효과적으로 생성하여 비즈니스를 지원하는 작업을 하고 있다. 가령, 컴볼트 퀵 리커버리는 스토리지 임베디드 스냅샷 기능을 통합하여, 제작 데이터에 대한 복수의 포인트-인-타임 스냅샷을 간단하게 생성하고 있다. 이 스냅샷에 내장된 컴볼트 QR 리커버리 볼륨은 데이터 손상과 바이러스 공격 후, 즉시 애플리케이션에 재연결이 가능하도록 해준다. QR과 마이크로소프트 VSS가 통합, 사용하기 간편한 인터페이스를 제공함으로써 모든 VSS 하드웨어 공급자들에 대한 일관된 관리가 가능해졌다.

2.데이터 관리에 대한 통합적 접근이 주는 가치
강력한 통합능력은 싱글 GUI 관리 콘솔, 관리를 위한 싱글 코드 베이스, 싱글 인덱스, 데이터 이동을 위한 싱글 시스템 인프라, 관리 단계 전체에 걸쳐 데이터 세트 관리에 사용되는 싱글 정책, 원스텝 복구 프로세스에서 어떤 단계가 가장 이용하기 좋은 데이터 사본을 가지고 있는지에 관계없이 확연히 드러난다. 모든 단계 장치를 공유하는 것은 전체 투자비용을 낮추는데 중요한 역할을 한다. 이 모두가 단일의 독특하고 유용한 솔루션 세트를 전달하게 되며, 이것은 추후 필요할 때마다 확장할 수 있다.

컴볼트의 Singular Information Management는 다음과 같이 독특한 이점들을 제공하고 있다:
* 제작 데이터에 대한 한 번의 접촉만으로 이후 모든 데이터 관리와 보고가 가능해져, 애플리케이션 성능과 엔드유저의 생산성이 극대화됨과 동시에 최고 수준의 복구 서비스 제공이 가능해진다.
* 언제, 어떻게 스냅샷을 생성하고, 백업 사본을 만들고, D2D(Disk-to-Disk)와 D2D2T(Disk-to-Disk-to-Tape)를 이용해 보조 사본을 만들지 자동화하는 단일 정책
* 제작 데이터가 손상되었을 시 온라인 리커버리 볼륨에 대한 신속히 설치
* 가장 이용하기 좋은 데이터 단계부터 제작이나 리커버리 볼륨까지의 원스텝 데이터 복구

데이터 보호 문제의 근본원인은 컴퓨팅의 시초부터 지금까지 거의 동일하다. 과거부터 지금까지 계속 데이터가 폭발적으로 증가한다는 것이다. ESG의 애널리스트 기업이 2005년에 실시한 조사에 따르면, 응답자들은 현재의 백업 복구 솔루션에 대해 5가지 문제점을 공통적으로 지적했다.

흥미롭게도 5가지 문제점 모두 시간에 관한 것이었다. "백업이 너무 오래 걸린다", "복구가 너무 오래 걸린다"라고 대답한 비율은 각각 66%와 49%였다. 이는 많은 기업들이 여전히 원하는 '백업 시간' 안에 대부분의 데이터를 처리하지 못하고 있다는 뜻이다. 정말 필요할 시기에, 백업 사본에서 데이터를 복구하여 이용 가능한 환경을 구현하지 못하고 있는 것이다.

급증하는 데이터는 모두 어디에서 오는 것일까? InfoPro 팀이 발표한 자료에 따르면, 데이터베이스와 콘텐츠 저장소, 파일 공유 및 이메일 시스템이 대부분의 데이터를 차지하고 있다고 한다. 이는 그다지 새삼스러운 일도 아니다. 데이터는 모든 사업 부문의 모든 사용자들로부터 나온다. 사실상 데이터의 양은 중복 백업 작업으로 만들어진 사본들, 컴플라이언스와 탐색을 위한 아카이빙의 사본들, 사본의 사본들과 같이 동일 데이터에 대해 여러 개의 사본을 보관해야 할 필요성이 대두되면서 더욱 늘어나게 되었다.

우리는 데이터 사본들을 과거보다 더 오래 보관해야 한다. 이제는 대부분의 데이터를 7년 동안 보관하는 것이 보통이며, 일부 데이터는 영구 보관하기도 한다. 왜일까? 법률이 지속적으로 변경, 생성되고 있기 때문이다. 어떤 데이터가 폐기해도 안전한지, 어떤 데이터를 법정에서 제시하지 못했을 때 수백만 달러의 돈을 지불하게 될지 알 수가 없다. 하지만 불행히도 현재 인류가 사용중인 대부분의 백업 소프트웨어는 대용량 데이터 보호에서 그다지 뛰어난 성능을 발휘하지 못하고 있다는 점이다.

3.기존 백업 소프트웨어가 대량 데이터 세트를 처리하지 못하는 이유들
현재 사용되고 있는 대부분의 백업 소프트웨어는 테이프나 광학 플래터가 백업 데이터 사본을 저장하는 방식만이 존재했던 과거에 설계된 것이다. 당시에는 전체 백업 세트가 약 100개 테이프 내로 맞춰질 수 있던 때였고, 테이프 회전이 테이프 드라이브 위에 테이프를 올려놓는 것을 뜻하던 시절이었으며, 테이프 추적이 달력이나 스프레드시트 위에서 진행되던 때였다. 사실 현재보다는 훨씬 단순한 모델이었다.

테이프에 관한 재미있는 사실은 바로 순차 기술이라는 점이다. 디스크 가격이 지난 30년 동안 크게 떨어지자, 테이프보다 더 빠르고 더 효율적이고 더 탄력적인 무작위 액세스 기술의 장점이 데이터 백업을 변모시켰다. 현재 전세계 기업들 절반 이상이 종합적인 데이터 보고 환경의 일환으로 B2D 방식을 채택하고 있으며, 그 수는 점점 증가하고 있다.

디스크의 효율성이 관리해야 할 데이터의 팽창을 처리하는데 도움이 될 것이라는 이론이 있다. 또한 일정하지 않은 장소에서도 데이터가 필요할 때가 있기 때문에, 테이프는 아직도 필수 요소로 자리잡고 있고, 앞으로도 이를 유지할 것이다.

데이터 복구관리의 세계적인 추세가 순차 매체에서 무작위-액세스 매체로 변화했지만, 대부분의 백업 소프트웨어는 그렇지 못했다. 데이터를 디스크에 백업하는 대부분의 소프트웨어는 여전히 디스크를 테이프처럼 사용하고 있다. 데이터는 순차적으로 기록되고, 순차적으로 인덱싱되며, 복구 시에 백업 소프트웨어는 한 디스크 안의 데이터를 모두 마치 테이프의 데이터처럼 읽어 들여야 한다.

테이프 카세트와 CD를 생각해보자. CD 플레이어인데도 좋아하는 노래를 듣기 위해 모든 트랙을 순차적으로 듣고 있어야 하는 것과 마찬가지이다. 이렇게 비효율적인 이유는 무엇일까? 대부분의 경우, 널리 사용되고 있는 백업 소프트웨어들로는 많은 것을 바꾸지 못하기 때문이다. 너무 많은 것을 바꾸면, '백워드 호환성(backward compatibility)'의 문제가 생긴다. 백워드 호환성은 백업 소프트웨어 제조사들에게 매우 중요한 문제다. 이것이 없으면 고객의 환경을 업그레이드하는 일이 너무나 어려워지기 때문이다. 그래서 세계는 1990년대 중반의 백업 소프트웨어 기술에서 성장이 멈춰버린 것이다.

4.디스크를 디스크로 관리함으로써 데이터 증가에 대한 초석 다지기
필수적인 디스크 관리 기능들이 포함된 백업 소프트웨어 제품들이 있다. 필자는 디스크 백업 복구 보호에서 최대한의 가치를 이끌어내는데 필요한 핵심 기능들에 대해 살펴볼 것이다. 이 기능들은 데이터 증가에 대한 초석을 다지려 할 때 필수적인 기능들이다.

다이렉트 액세스 복구 (Direct Access Restore, DAR)
다이렉트 액세스 복구(DAR)는 테이프처럼 디스크의 데이터를 순차적으로 읽을 필요 없이 복구에 필요한 장소로 바로 이동함으로써 디스크를 최대한 효율적으로 사용한다. DAR은 디스크 데이터로의 고속 액세스와 데이터 복구에 핵심적인 기능으로서, 네트워크 스토리지에 대한 투자로부터 보다 나은 가치를 이끌어내고 대용량 데이터의 복구 시간을 앞당길 수 있다.

▪싱글 패스 복구 (Single Pass Restore)
전형적인 백업 사이클은 'full' 백업으로 구성되어 있고, 이것은 보통 1주일이나 2주일에 한 번씩 백업을 실행하고, 'incremental'이나 'differential' 백업으로 'full' 백업들 중간에 변경된 데이터를 찾아내 보호한다. 이것은 백업 프로세스를 보다 효과적으로 만든다. 그러나 'fulls'와 'incrementals'를 실행하는 대부분의 소프트웨어들의 복구는 성능이 떨어지고 비효율적이다. 가장 최근의 incremental을 복구한 후 전체 이미지를 구축하는 것이 아니라, 대부분의 소프트웨어들이 full을 먼저 시작한 후 역순으로 incremental을 읽는다. 즉, 복구 프로세스에 폐기된 incremental들이 모두 포함된다. 필요 이상의 데이터가 복구된다는 뜻이다. 이것은 소요 시간을 증가시킬 뿐만 아니라, 한 번에 한 데이터 조각만 복구하는 효율적인 복구 프로세스와 비교했을 때 디스크 공간을 크게 증가시킨다.

이와 비교해, 싱글 패스 복구 프로세스는 가장 최근의 incremental과 differential을 먼저 읽어 들인 후, 과거에 폐기된 데이터 사본들을 건너뛴다. 이 프로세스는 강력한 인덱싱 모델에서만 가능하다. 이것은 디스크 무작위-액세스 기능을 활용하는 모델이다.

장애극복 재개(Failover Resume)와 대체 데이터 경로(Alternate Data Paths)
네트워크 스토리지 장치에 투자를 할 때에는 그 투자에 대한 일정 수익을 기대하게 된다. 안타깝게도 네트워크 스토리지가 발명되기 전인 1990년대 중반에 설계된 백업 소프트웨어를 계속 사용한다면, 네트워크 스토리지에서 거둘 수 있는 수준의 수익을 얻기는 힘들 것이다. 네트워크 상에 있기 때문에 각각의 장치들에 수많은 서버 시스템들이 액세스 가능하다는 것이 네트워크 스토리지의 미덕이다. 백업 소프트웨어는 인프라 사용에 맞는 적절한 구성을 통해 데이터 보호에서 상당한 장점을 제공할 수 있다. 두 가지 핵심 기능은 아래와 같다:

* 장애극복 재개(Failover resume)

* 대체 데이터 경로(Alternate data pathing)
장애극복 재개(Failover resume)는 데이터 관리 작업을 백업이 섰거나 네트워크가 장애를 일으킨 장애지점부터 재개하는 기능이다. 이것은 단순히 작업을 처음부터 재시작하는 것과는 상당히 거리가 멀다. 재개는 특히 대용량 백업이나 복구 작업에 필수적이며, 작업 완료에 즈음하여 장애가 생긴 경우에 특히 필수적이다.

대체 데이터 경로는 스토리지 장치로의 대체 네트워크 경로를 이용해 데이터 관리를 자동 재개할 수 있는 기능을 말한다. 이것은 특히 NIC가 IP 네트워크에서 장애를 일으켰을 때, 그리고 파이버 카드가 SAN 배치에서 장애를 일으켰을 때 유용하다. 이 기능들은 테이프 보호와 디스크 기반 보호에 매우 유용하며, D2D2T 데이터 관리 시스템을 크게 향상시킬 수 있다.

▪데이터 이동성-D2D와 D2D2T
스토리지 계층들 간의 데이터를 이동시키고 디스크에서 테이프로 데이터를 이동시키는 것은, 다층화되어 있는 성숙한 다단계 스토리지 환경을 관리할 때 당면하게 되는 문제이다. 복구가 불완전한 채 이동이 막혀버리는 'dead-end' 아카이빙 없이, 스토리지 등급과 스토리지 브랜드들을 넘나들며 필요한 시기에 필요한 방법으로 데이터를 이동시킬 수 있는 이동성이 필요하다. 이러한 데이터 이동성은 D2D와 D2D2T 기능 같은 데이터 보호 솔루션에서 제공된다. 이런 유형의 복사 기능들은 다음과 같다:

* Inline copy: 한 개 이상의 백업 사본을 동시에 만들 수 있다.

* Selective copy: 원본 데이터 사본을 원본 스토리지 장소에서 잘라내기 직전에 두 번째 사본을 다른 등급의 스토리지에 만들 수 있다.

* Cascading copy: 한 사본에서 두 번째 사본을 만들 수 있다.

데이터 사본 생성에서 이런 종류의 탄력성은 등급이 다른 스토리지가 제공하는 가치를 활용하는데 필수적이다. 고속 복구를 위해 더 높은 원가의 스토리지, 이를테면 디스크에 데이터를 보존하는 동시에, 테이프와 같은 저가의 스토리지로 다른 데이터를 이동시킬 수 있다. 보조 데이터 사본 생성에 대한 유연성이 복구 기능을 방해하는 것은 아니다. 발달된 데이터 보호 솔루션은 보조 백업 사본으로부터 오리지널 클라이언트 시스템으로 직접 원스텝 복구를 제공한다. 우수한 시스템들은 가장 쉽게 이용 가능한 데이터 사본을 추적하여 찾아내지만, 관리자가 사본을 관리해야 할 필요가 없도록 한다.

5.액티브-아카이빙으로 초석 다지기
마지막으로 액티브-아카이빙을 디스크-기반 데이터 보호에 추가하면, 팽창하는 데이터를 관리하는데 도움이 된다. 액티브-아카이빙은, 관리 대상 데이터의 양은 축소하되, 엔드유저의 데이터 접근성은 훼손시키지 않는 방식을 사용한다.

파일 프린트 서버나 애플리케이션 서버에서는, 15%만이 액티브 용도로 사용되는 것이 보통이다. 그리고 이 데이터는 디스크 공간을 차지하기 때문에 새 디스크를 구입하게 만든다. 또한 백업 시간을 늘리고, 백업 사본을 위해 추가 디스크 및 테이프 스토리지를 필요로 한다. 컴볼트에서 제공하는 아카이빙 소프트웨어를 이용하면 이러한 문제를 말끔히 해결할 수 있다. 방법은 불활성 데이터를 보조 디스크나 테이프 스토리지로 옮기는 것이다.

이런 종류의 방식에서는 파일의 해당 데이터 부분만 실제로 옮겨지고, 파일 기록은 원본 파일 시스템 장소에 남아 있다. 보통 'stub'이라 불리는 이러한 방식은 원본 파일과 비교했을 때 훨씬 작은 공간을 차지하면서도 엔드유저에게는 그 데이터가 계속 있는 것처럼 파일을 보고 선택할 수 있도록 해준다. 엔드유저가 특정 파일을 선택해 열면, 소프트웨어는 보조 스토리지 장소에서 그 데이터를 검색해 복구한다. 이렇게 하면 관리자가 복구 프로세스에 관여할 필요가 없어진다.

잘 설계된 액티브-아카이빙 소프트웨어는 테이프와 디스크가 보조 스토리지 장소처럼 사용되게 할 수 있다. 물론 검색 시간이 디스크보다 약간 길어질 수 있지만, 스토리지 비용이 낮아지기 때문에 일부 유형의 데이터에서는 이를 충분히 상쇄할 수 있다. 이 경우, 능동적인 마이그레이션 소프트웨어는 데이터 검색에 필요한 테이프가 없을 때 엔드유저와 시스템 관리자에게 이를 통보할 수 있어야 한다. 액티브-아카이빙 소프트웨어는 마지막 사용일자나 데이터의 연령에 따라 데이터를 이주시키는 경우가 가장 많다. 애플리케이션, 사용자 등급, 데이터 유형 등과 같은 추가 요소에 기초한 데이터 분류 기능으로 이동을 시키는 경우는 이보다 드물다.

백업 소프트웨어와의 통합은 액티브-아카이빙 소프트웨어의 가치를 실현하는 핵심요소이다. 데이터를 보관하지만 백업 복구 프로세스들을 지원하지 못하는 소프트웨어, 또는 백업 소프트웨어가 파일 시스템을 구동할 때 보관된 데이터의 검색이 시작되는 소프트웨어는 그 가치를 제대로 발휘하지 못한다. 가장 이상적인 경우는, 아카이빙 소프트웨어가 백업 복구 작업에 통합되어 최대한의 가치를 발휘하는 경우이다.

필수적인 기능: 아카이빙을 위한 데이터 이동성
오늘날 전세계 대부분의 아카이빙 소프트웨어는 'dead-end'라 할 수 있는 데이터 아카이빙들을 생성한다. 이런 아카이빙은 프로세스의 과정으로 아카이빙 전체를 검색하지 않고는 복사, 이주, 이동이 불가능하다. 이 문제는 인라인, 보조적, 선택적 사본 옵션들을 가진 데이터 이동성을 제공하는 아카이빙 소프트웨어를 선택해 방지할 수 있다.

지금까지 우리는 최근 기업들 사이에서 급증하는 데이터로 인한 문제와 이를 말끔히 해결할 수 있는 효과적인 복구 관리 개념에 대해서 개괄적으로 알아보았다. 다음에는 이러한 복구 관리의 실질적인 방법과 활용사례에 대해 살펴보도록 하겠다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지