특정 솔루션 아닌 비즈니스 연속성 측면에서 접근해야

 
[컴퓨터월드] 오늘날 기업들은 정보기술(IT)에 대부분의 업무와 서비스를 의존하고 있다. 각종 재해로 인한 IT서비스의 중단과 데이터 유실은 단순히 비즈니스의 효율을 떨어뜨리는 수준을 넘어 전체 비즈니스의 중단으로까지 이어진다. 이로 인한 손해는 비즈니스 기회 손실을 넘어 기업이미지 상실과 고객이탈까지 장기적으로 나타난다.

최근에는 기업의 ‘디지털 전환(Digital Transformation)’ 가속화 바람을 타고 데이터의 중요성이 더욱 강조되고 있으며, 기업이 재해로 인한 데이터 유실이라는 최악의 상황을 맞이할 경우 존폐를 논할 정도의 치명적 결과를 불러올 수도 있다. ‘보험’ 역할을 하는 재해복구 및 백업 시스템에 대한 투자가 비용 부담에도 불구하고 ‘필수’로 여겨지는 이유다. 기업의 생존을 담보하는 엔터프라이즈급 재해복구에서부터 중견·중소기업을 위한 데이터 보호까지 폭넓게 살펴본다.


DR 구축, 기업 생존 위해 ‘필수’

IT 관점에서 말하는 재해복구(Disaster Recovery, DR)란, 각종 재해 및 위험요소에 의해 정보시스템이 중단됐을 때 이를 정상으로 회복시키는 것을 의미한다. IT에서의 재해는 사전적 의미를 벗어나 ▲지진, 태풍, 홍수, 화재 등의 자연재해 ▲테러로 인한 폭파, 전쟁, 해킹, 통신장애, 전력공급차단 등 외부요인에 의한 재해 ▲시스템 결함, 기계적 오류, 관리정책 오류, 사용자 실수 같은 내부적 요인에 의한 장애 등 다양한 사례를 포함한다.

대형 지진처럼 발생 가능성이 극히 낮은 재해를 제외하더라도, 홍수 등에 의한 침수나 화재로 인한 전소 등은 언제라도 찾아올 수 있는 위협이다. 이러한 사고들이 기업 전산센터에 발생했을 경우, 관련 인프라를 물리적으로 ‘완전히’ 복구하는 데에는 최대 수개월까지 소요될 수 있다.

이처럼 인프라 및 서비스를 최종적으로 복구하는 것까지를 넓은 의미의 DR로 이해할 수도 있겠지만, 실제로 기업 IT서비스를 운영하는 입장에서는 이미 일어난 재해를 뒤로 하고 빠르게 서비스를 재개하는 것이 최우선 과제다. 따라서 IT 운영 측면에서의 ‘DR시스템 구축’은 재해 발생 시 서비스를 최대한 빠른 시간 내에 다른 시스템으로 대체해 운영할 수 있도록 평소에 대비하는 것을 말한다.

IT업계에서는 DR의 중요성을 전 세계에 알린 사건으로 2001년 미국 9.11 테러를 꼽는다. 당시 세계무역센터에 입주해 있던 350여 기업들의 전산시스템은 건물 붕괴와 함께 대부분 파괴됐다. 하지만 모건스탠리, 메릴린치, 뱅크오브아메리카 등은 다음날, 혹은 며칠 만에 업무를 재개했는데 이는 평소 총체적 재난대비훈련은 물론 백업센터를 통한 데이터 복구가 뒤따라줬기에 가능했다. 반면 그러한 대응을 하지 못했던 150여 입주기업은 차례차례 도산했다.

국내에서는 이에 앞서 2000년 동원증권의 데이터센터가 침수돼 3일간 주식거래 업무가 마비된 적이 있었다. 여기에 9.11 테러가 발생하면서 DR에 대한 인식이 커지기 시작했다. 금융감독원은 2001년 금융사를 대상으로 재해 발생 시 3시간 이내에 복구할 수 있도록 DR센터를 구축·운영할 것을 권고했다. 금융사들은 명문화된 규정에 따라 DR시스템 구축에 나섰지만, 실제 사고가 발생하자 문제점들이 드러났다.

2010년 시티은행은 인천 주 전산센터 냉각기 동파로 인한 시스템 침수로 전자금융거래가 모두 중단되는 사고를 겪었는데, 서비스 중단은 6시간 이상 이어졌다. 2014년에는 삼성SDS 과천 데이터센터에서 화재가 발생, 삼성그룹 전 계열사의 업무가 마비됐다. 백업장비를 가동해 서비스를 상당부분 재개했음에도, 삼성카드의 온라인 거래는 일주일 넘게 서비스가 중단됐다. 해당 부분에 대한 DR시스템이 아직 구축 전이라는 이유에서였다.
 

▲ DR의 중요성을 상기시켰던 9.11 테러(좌)와 삼성SDS 과천 데이터센터 화재 사건(우)

DR의 필요성에 대한 국내 인식은 이러한 사건들을 겪으면서 상당히 개선됐다. 규정을 준수해야 하는 금융권은 물론이고, 복구의 신속함은 다를지언정 산업 전반에 걸쳐 DR시스템을 구축하려는 의지는 기본적으로 갖고 있다는 게 관련 업계의 공통된 시각이다.

이진현 맨텍 이사는 “국내의 경우 금융감독원의 권고에 따라 의무적으로 DR시스템을 구축해야하는 금융권이 많은 수요를 차지하고 있는 게 사실”이라며, “하지만 공공기관 역시 통합 DR센터를 구축하고 있으며, 권고안이 아니더라도 최악의 사태들을 경험한 이후에는 공공, 통신, 대기업 등에서 ‘DR시스템 구축은 선택이 아닌 필수’라는 인식이 강해졌다”고 말했다.

또한 최근에는 작은 장애가 곧바로 비즈니스 손실로 이어지는 온라인 쇼핑몰 및 전자결제 분야와 시스템 중단 시 환자 생명을 위협할 수 있는 의료 분야 등에서도 DR시스템 구축이 늘어나고 있다는 게 업계에서 체감하는 시장 분위기다.


DR, 서비스 지속의 관점으로 봐야

그렇다면 DR시스템 구축을 위해서는 무엇이 필요할까. 일정 규모 이상의 기업이 DR을 구축할 경우, 단순히 백업 및 스토리지 솔루션을 구매하는 것만으로는 해결되지 않는다. 오늘날에는 기업의 규모가 클수록, 혹은 사업의 특성에 따라 IT서비스에 대한 의존이 더욱 커지고 있으며 이러한 기업들에게는 재해로 중단된 서비스를 빠르게 대체해 이어나가는 것이 DR시스템 구축의 최종 목표가 되기 때문이다.

김지현 베리타스코리아 이사는 “다양한 인프라들을 DR센터에 똑같이 구축함으로써 중단된 서비스를 그대로 이어가는 것이 오늘날 DR의 최종 목표라고 할 수 있다. 각 인프라 구성요소가 DR을 지원한다고 해서 DR 구축을 완료했다고 말할 수는 없으며, 서비스 관점에서의 복구 체계를 갖춰야 한다”면서, “단순히 원격지에 데이터 복제를 해 놓았다고 해서 실제 애플리케이션 기동까지 가능할 거라 생각하면 안 된다. 중요한 것은 재해가 생겼을 때 성공적인 DR센터로의 서비스 전환에 대한 확신”이라고 강조했다.

재해로부터 IT서비스를 재개하기 위해서는 BCP(Business Continuity Planning, 업무연속성계획)를 통한 포괄적 대비가 우선돼야 한다. BCP는 ▲재해·재난이 업무 및 자산에 미칠 영향을 분석하고(BIA, Business Impact Analysis) 관리 및 감시까지 수행하는 예방 단계에서부터 ▲이를 바탕으로 재해에 대비한 전략을 수립하며 ▲상황 발생 시 대응 계획 ▲피해 시 복원 절차 등까지 전 과정에 대한 계획을 체계적으로 수립하는 것을 말한다.

BCP의 대상은 전산시스템뿐만 아니라 직원, 미디어 등의 관련요소 등을 모두 포함하며 흔히 IT업계에서 말하는 DR시스템 구축은 이 중 전산시스템 영역에 해당된다. 전산시스템에는 서버, 네트워크(NW), 스토리지, 운영체제(OS), 애플리케이션, 데이터베이스(DB) 등이 포함되며 DR을 위해서는 해당 요소들의 복구를 통합적으로 고려해 단계적으로 진행해야 한다.

각 요소들을 고려한 DR시스템 구축을 위해서는 먼저 BCP 중 BIA(업무영향분석)에 따른 복구 범위 및 수준의 설정이 선행돼야 한다. 복구해야 할 업무의 중요도에 따라 우선적으로 복구해야 할 애플리케이션 및 데이터를 설정하고, 장애 후 수용 가능한 다운타임인 RTO(Recovery Time Objective, 복구목표시간)와 수용 가능한 데이터 손실 시점인 RPO(Recovery Point Objective, 복구목표시점)를 고려해 RLO(Recovery Level Objective, 복구목표수준)을 결정한다. 데이터 손실과 다운타임이 적게 DR시스템을 구성할수록 비용이 늘어나므로, 적절한 수준으로 RLO를 설정하는 것이 중요하다. 

▲ RPO, RTO 개념도 (자료: 맨텍)

유재근 퀀텀코리아 부장은 “일반적으로 BIA를 실시하면 업무 및 데이터의 중요도에 따라 등급을 나누게 되는데, 예를 들어 1등급이라면 RPO를 제로(0)에 가깝게 설정해 재해 발생 직전의 시점으로 복구하는 것을 목표하게 된다. 은행으로 치면 입금기록처럼 실시간으로 데이터 로스(data loss)없이 유지해야 하는 데이터라고 할 수 있다”고 설명하고, “반면 3등급의 경우 장기보관 데이터로서 RPO 24시간 이내, RTO 일주일 등으로 설정되는 경우가 대부분이다. 1등급은 보통 스토리지 단위에서 다루는 범위로 복구 우선순위고, 퀀텀 같은 백업솔루션 업체는 2·3등급의 데이터를 위한 DR솔루션을 제공한다”고 덧붙였다.


DR센터, 운영 방식과 위치 등 고려해야

DR센터를 어떤 방식으로 운영할 것인가도 중요한 문제다. 운영 주체별로는 ▲자체운영 ▲공동운영 ▲위탁운영 등으로 구분되며, 구축 형태별로는 ▲독자구축 ▲공동구축 ▲상호구축 등이 있다. 

▲ DR시스템의 구축 형태별 유형 (정보통신부, 2005)

독자구축은 보안 및 복구 신뢰성이 상대적으로 높지만, 구축 및 유지비용이 높아 대규모 금융기관이나 포털사이트, 대기업 등에서 채택하고 있다. 공동구축은 2개 이상의 기관이 DR센터를 공동으로 이용하는 방식으로 비용 측면에서 이점을 갖지만, 보안 및 운용 복잡성 증가 문제가 있으며 광역 재해가 발생하면 동시 DR이 불가능하다는 게 단점이다. 상호구축의 경우 두 전산센터가 재해 시 서로의 DR센터 역할을 수행하는 방식으로, 비용은 절감되지만 기술적으로 까다롭고 신뢰도가 낮다. 실제 미국에서는 재해 시 상대 기관의 협조 불충분으로 복구를 실패했던 사례도 있었다.

DR센터의 위치도 고려해야 한다. 대형 지진이나 홍수 등의 광역재해가 발생하거나 지역적인 전력공급 중단 사태가 벌어질 경우, 주 전산센터와 DR센터가 동시에 기능이 정지하게 될 수 있음을 염두에 둬야 한다. 국내의 경우 시스템 장애나 센터 내의 사고 대비 위주로 DR센터가 구축돼 있어, 대부분 센터 간 거리가 100㎞ 이내라는 점이 문제로 꼽히기도 한다.

효성인포메이션시스템 관계자는 이에 대해 “우리나라는 지진 같은 광범위한 자연재해 대비에 상대적으로 관심이 적은 편”이라며, “최근 경주지역에서 진도 5.8의 지진이 발생했듯이 우리나라도 지진영향권에서 자유롭지 않다고 생각하면, 충분한 거리를 확보한 진짜 DR센터의 구축이 필요한 시점”이라는 의견을 내놨다.

하지만 실제 국내 기업들의 데이터센터는 대부분 수도권 주변에 밀집해 있는 상태로, 센터 간 거리가 50㎞ 미만인 경우도 많다. 이는 접근성과 비용 부담 문제에 의한 것으로, 최근 각광받고 있는 실시간 동기식 스토리지 복제 기술로 DR센터를 구축할 경우 네트워크 전용선(DWDM, 고밀도파장분할다중) 사용 시 거리에 따라 비용 부담이 커지게 되며 TCP/IP 사용 시에는 응답 지연 현상이 생긴다. 또한 재해 발생 시 DR센터로 인력이 이동하는데 걸리는 시간도 RTO 3시간 충족을 위해 중요하므로, 일반적으로 100km 이내에서 DR센터를 구축하는 것을 고려하게 되는 것이다.

이 밖에 복구 수준별로는 ▲주센터와 동일하게 DR센터를 구성해 실시간으로 양 센터에서 동시에 서비스를 진행하는 액티브-액티브(Active-Active) 방식의 ‘미러사이트(Mirror Site)’ ▲실시간 스토리지 미러링을 통해 데이터는 최신으로 유지하지만, 재해 시에만 DR센터 전체를 가동하는 ‘핫사이트(Hot Site)’ ▲중요 데이터만 주기적으로 백업해 보유하는 ‘웜사이트(Warm Site)’ ▲재해를 대비해 최소한의 데이터만 확보하는 ‘콜드사이트(Cold Site)’ 등으로 DR센터의 종류를 나눌 수 있다.


엔터프라이즈 스토리지 이중화 vs. SMB 클라우드 DR

일반적으로 DR시스템 구축은 스토리지업체가 많이 강조한다. 기업 IT자산의 핵심인 데이터를 다루기 때문이다. 과거의 DR이 재해가 발생한 후 DR센터를 가동하는 ‘핫사이트’ 위주였다면, 오늘날 스토리지 업체에서는 고가용성(High Availability, HA)을 위해 ‘미러사이트’ 방식과 대응하는 ‘액티브-액티브 이중화’를 대세로 꼽는다. 데이터센터 내의 ‘스토리지A’와 DR센터의 ‘스토리지B’가 서로 데이터를 실시간으로 복제해 동일한 데이터를 보유하므로, 한 곳에 재해가 발생해도 나머지 한 곳이 중단 없이 서비스를 이어갈 수 있다.

조민준 델 EMC 차장은 “오늘날의 DR은 단순한 데이터 복구가 아닌, 가용성과 비용절감 측면에서 접근해야 한다”면서, “스토리지 업계에서는 재해가 발생해도 서비스의 중단 없이 운영할 수 있는 고가용성은 물론, 쓰지 않는 장비를 보험용으로 구축만 해두기보다는 함께 사용함으로써 비용절감까지 실현하는 제품을 내놓고 있다”고 설명했다. 

▲ 액티브-스탠바이 방식과 HDS ‘GAD’ 기술의 액티브-액티브 방식 비교 (자료: 효성인포메이션시스템)

하지만 이처럼 엔터프라이즈 스토리지 업체에서 제공하는 액티브-액티브 방식의 DR은 비용부담이 크기 때문에 일정 규모 이상의 기업들을 위주로 구축되고 있는 것이 현실이다. 중소기업들은 데이터 백업만으로도 대규모 자연재해가 아닌 한 최소한의 대비를 갖출 수 있기에, 대부분 ‘데이터 백업’ 수준의 DR 대책을 보유하고 있으며 이마저도 하지 않는 경우도 많다. 이에 최근 몇 년간 클라우드 기반의 백업 및 DRaaS(서비스형DR)가 중견·중소기업을 위한 DR 대책으로 제시되고 있다.

고강혁 퀀텀코리아 부장은 “DR 구축은 기업들이 비용 때문에 주저하는 경향이 있긴 하지만, 자금에 여유가 있다면 반드시 해야 하는 업무의 일환으로 생각하고 있다”면서, “중소기업의 경우에도 예산상의 문제로 못하는 경우가 많긴 해도 ‘클라우드를 이용해서라도 해야 하지 않겠느냐’란 인식이 있다”고 말했다.

김태형 한국IBM 글로벌 테크놀로지 서비스 실장은 “IBM은 DR 전체 과정에 대한 서비스형 사업을 하고 있는데, 실제로 고객들은 대부분 대기업 및 금융권의 유닉스 고객이다. 하지만 최근 국내 데이터센터를 가동한 IBM 소프트레이어(Softlayer) 클라우드 기반 DR에 대해서 중견·중소기업으로부터 문의가 늘어나고 있다”고 밝혔다.

서호익 아크로니스코리아 한국지사장은 “아크로니스는 ‘중소기업들이 재해복구를 좀 더 쉽게 할 수 없을까’ 라는 고민에서 출발한 백업 제품을 내놓고 있다. x86 환경이 대부분인 중소기업들과 특히 최근 제조사들이 생산 운영 인프라의 DR을 위해 마이크로소프트(MS) ‘애저(Azure)’ 등에 연동, 아크로니스의 백업 및 DRaaS 기능을 많이 사용하는 추세”라고 말했다.

여동재 컴볼트코리아 이사는 “컴볼트는 비용이 많이 드는 DR센터 운영을 클라우드로 손쉽게 구성할 수 있도록 지원한다. 컴볼트 ‘데이터플랫폼(Data Platform)’의 ‘라이브싱크(Live Sync)’ 기술을 통해 아마존웹서비스(AWS) EC2 및 MS ‘애저’ 클라우드의 가상머신(VM) 기반 환경으로 이전(migration)할 수 있다”고 설명했다.


통합관리 및 자동화도 주목

스토리지나 백업 영역뿐만 아니라, DR 전체 과정의 통합 관리 및 자동화에 집중하는 솔루션도 있다. 복잡한 물리 및 가상화, 클라우드 환경을 통합 관리하고 재해 발생 전에는 센터 간 데이터 및 시스템 구성을 모니터링해 리포팅을 제공하며, 복구 테스트도 할 수 있는 소프트웨어(SW) 기반의 제품들이다. 재해 발생 시에는 미리 정의한 워크플로우에 따라 시스템이 페일오버(failover, 자동전환)되도록 지원하기도 한다.

김지현 베리타스코리아 이사는 “주센터에서 문제가 생겼을 경우 DR센터로의 페일오버를 지원하는 ‘베리타스 레질리언시플랫폼(Veritas Resiliency Platform)’은 수작업으로 이뤄지는 점검 및 전환 과정의 오류를 줄여준다. 또한, ‘베리타스 리스크어드바이저(Veritas Risk Advisor)’는 OS 및 애플리케이션의 버전 변동과 시스템 구성 변경 등을 정기점검하고 센터 간에 동일하게 적용하도록 돕는다”고 설명했다.

이진현 맨텍 이사는 “맨텍은 서버이중화, 서비스 중단요소 감시, 자동 페일오버, 데이터 복제 등을 지원하는 ‘MCCS(Mantech Continuous Cluster Server)’와 DR센터의 운영·관리 자동화를 제공하는 ‘MDRM(Mantech Disaster Recovery Maestro)’ 제품을 보유하고 있다”고 밝혔다.
 

“빅데이터, 머신러닝 기반 리질리언시 서비스로 비즈니스 전체 보호”
김태형 한국IBM 글로벌 테크놀로지 서비스 실장


▲ 김태형 한국IBM 글로벌 테크놀로지 서비스 실장
IBM의 DR에 대해 소개해 달라.

IBM은 기술뿐만 아니라 서비스적 측면까지 DR의 모든 것을 제공할 수 있는 회사다. 재해 발생 시의 문제는 IT뿐만이 아닌 비즈니스 전체에 관한 것이다. 리스크, 비즈니스 성과, 사건·사고, 비용 등의 관리까지 종합적으로 분석하고 이를 위한 전략까지 제공한다는 것이 가장 큰 차별점이다.

IBM은 특정한 몇 가지 솔루션을 제공하는데 그치는 것이 아니라, 자사 제품이 아니더라도 필요한 타사 DR 솔루션들을 맞춤 구성해 제안한다. 또한 고객사가 한 번에 모든 시스템을 볼 수 있는 포털과 뷰를 제공함으로써 크리티컬한 워크로드의 위치, 이전 대상의 위치 등을 포함해 ‘리질리언시’를 통합적으로 지휘·관리할 수 있도록 한다.

오늘날 IBM GTS(Global Technology Service)의 ‘리질리언시(Resiliency; 탄성, 복원성)’ 서비스는 세계적으로 리더십을 인정받고 있으며, 현재 고객사 규모가 1만 곳 이상, 담당 직원 규모는 4천 명 이상이다. 이 밖에 2016년 DRaaS 부문에서도 가트너에 의해 독보적인 ‘리더’로 선정됐으며 최근 3년 사이 클라우드 리질리언시 분야에서 두 자릿수의 성장률을 보이고 있다.


구체적으로 IBM ‘리질리언시 서비스’가 어떤 것인지.

IBM ‘리질리언시 서비스’는 템플릿, 분석(analytic) 툴, 모바일 툴, 코그너티브(congnitive) 툴 등을 사용해 ▲조직 구성과 성격을 정확히 파악하고 ▲시스템에 투입할 직원의 특징을 파악해 비즈니스 전반의 DR 전략을 생성하며 ▲시스템을 구축하고 유지 관리하는 등 엔드-투-엔드(end-to-end) 역량을 제공한다.

여기에 서비스 생명주기 관리, 컨설팅, 대행 서비스 등까지 폭넓게 제공하고 있으며 이를 위해 빅데이터와 클라우드 컴퓨팅, 인지컴퓨팅(cognitive computing) 플랫폼 ‘왓슨(Watson)’ 등의 기술을 적극 활용하고 있다.

즉, IBM은 기존 ‘사후 처리’ 방식의 BCP를 넘어 고객들이 예측을 통해 ‘사전에’ 재해를 예방 및 대비하는, ‘코그너티브’ 방식의 리질리언시 프로그램으로 이전하도록 돕기 위해 새로운 기능의 개발에 투자하고 있다. 이러한 기술의 궁극적인 목표는 재해가 발생하기 전에 재해가 미치는 영향을 회피하는 데 있다.

또한, IBM은 최근 ‘서비스형 리질리언시 커뮤니케이션(Resiliency Communication as a Service)’을 출시했는데, 이는 조직에 크고 작은 사건이 발생했을 때 어떻게 커뮤니케이션하고 대응할지에 대해 서비스하는 것이다.

이 서비스는 테러나 홍수 등의 재해 발생 시 모바일을 비롯한 각종 기술, 지도, 기상데이터 등을 이용해 DR 직원이나 해당 분야 전문가가 어디에 어떻게 투입돼야할지 판단해준다. 각 직원의 소재지를 파악하고, 어느 직원이 어떤 기술을 보유하고 있으며 어떻게 도움을 주고받을 수 있는지에 대해 현황 파악이 가능하다. 기업의 인적·물적 자원을 파악해 현장 고객까지 지원하는 커뮤니케이션이 가능한 것이다.


성공적인 DR시스템 구축을 위해 필요한 것은 무엇일까.

과거에는 재해 발생 시 단순히 IT시스템을 복구하는 것을 목표로 했지만, 요즘은 비즈니스 영역별로 상대적인 중요도를 고려해 비즈니스 연속성을 확보하는 방향으로 발전되는 추세다. 융합된 정보 위험 관리와 재해에 대한 선제적 대응을 강조하는 ‘비즈니스 탄력성(business resilience)’으로 진화하고 있는 것이다.

먼저 기업은 위험 요인 분석과 업무 분석을 통해 비즈니스 중심의 재해 대응 전략 및 체계를 수립할 필요가 있다. 업무별 중요도나 업무별 상관관계에 대한 고려 없이, IT시스템 단위로 DR시스템을 구성해서는 안 된다. 비즈니스를 위한 DR을 해야지, DR를 위한 DR이 돼서는 안 된다는 얘기다. 개별 업무가 중단됐을 경우 영향을 받을 수 있는 재무, 기업 이미지, 고객 만족 등에 대해 기업의 전략에 맞춰 업무를 분석하고 업무별 상관관계 분석을 통해 복구 우선순위를 도출함으로써 비즈니스 중단 영향을 최소화할 수 있는 재해 대응 체계를 마련해야 한다.

둘째, 재해 대응 솔루션을 선택하고 적용하는 과정에서 업무 중요도에 따라 차별화된 솔루션을 적용해야 한다. 데이터 백업, 스토리지 복제 등 획일적인 솔루션을 적용하면 복구 목표치를 달성하지 못하거나 고비용을 지출할 수도 있다. 업무 중요도에 따라 복구 목표 시간을 설정하고, 이에 따른 DR솔루션을 차별 적용해 비용효율적인 재해 대응체계를 갖춰야 한다.

마지막으로, DR시스템의 평상시 활용 방안을 마련해야 한다. DR용으로 쓰이는 시스템들을 일종의 보험 성격으로 생각하고 전용 자원을 구성하다보니, 용량을 낮게 산정해 다른 용도로의 활용성이 떨어지는 경우가 많다. DR 용도 이외에 주 센터 업무 분산, 개발이나 테스트 자원으로의 활용 등을 고려한 DR시스템 구축 및 운영 전략을 개발해 자원의 활용성을 높여야 한다.

 

업체별 DR 관련 제품 소개

01 델 EMC | 데이터 보호 어플라이언스 ‘브이플렉스’

▲ EMC ‘브이플렉스’
최근 합병을 완료한 델테크놀로지스(Dell Technologies)의 엔터프라이즈 솔루션 그룹인 델 EMC(Dell EMC)는 DR을 위한 대표적 제품으로 ‘브이플렉스(VPLEX)’ 어플라이언스를 내세우고 있다.

우선 ‘브이플렉스’는 SAN(Storage Area Network) 스토리지와 서버 사이에 위치, 이기종 스토리지 자원을 통합하는 가상화 플랫폼으로 기능하면서 스토리지 로컬 이중화 역할을 수행할 수 있다.

DR시스템 구축을 위해서는 ‘브이플렉스’를 주 전산센터와 DR센터에 한 대씩 각각 배치하면 ‘브이플렉스 메트로(Metro)’ 구성으로 원격지 이중화가 구현된다. 이로써 양 데이터센터 간 스토리지를 모두 액티브-액티브 상태로 관리할 수 있게 돼 중요 업무 스토리지에 장애가 발생하거나 시스템 유지보수 시에도 무중단 서비스가 가능하다. 데이터센터들이 최대 200km 이상 떨어져 있어도 가상화 기술을 통해 스토리지를 단일 통합자원으로 인식하고 데이터를 공유함으로써 상시적인 데이터 정합성을 보장할 수 있다. 

▲ EMC ‘브이플렉스’ 기능 (자료: 델 EMC)

박준영 델 EMC 부장은 “델 EMC ‘브이플렉스’는 DR의 단순화와 자동화를 위한 제품”이라고 소개하면서, “실수 혹은 고의로 스토리지 데이터가 삭제돼도 스냅샷(snapshot) 기반 시점복구를 지원하는 ‘리커버포인트(Recover Point)’ 솔루션과 결합해 데이터를 보호할 수 있다”고 덧붙였다.


02 효성인포메이션시스템 | ‘GAD’ 탑재한 HDS ‘VSP G1000’ 스토리지

효성인포메이션시스템(HIS)은 히타치데이터시스템즈(HDS)의 스토리지 ‘VSP G1000’을 대표적 DR 스토리지 솔루션으로 내세우고 있다. HDS 독자 기술 ‘GAD(Global Active Device)’를 탑재해 스토리지간 완벽한 액티브-액티브 기능을 구현함을 자부한다.

‘VSP G1000’에 탑재된 ‘GAD’는 2대의 스토리지를 하나의 가상 시리얼 번호로 통합, 동일한 하나의 가상 스토리지 머신으로 인식하는 방식이다. 2대의 스토리지 간 볼륨 미러링을 구성해 한 대의 스토리지 볼륨처럼 관리하며, 스토리지 간 자유로운 무중단 볼륨 이동이 가능하다. 또한 한 대의 스토리지에 장애가 발생하더라도 무중단 페일오버를 지원한다. 

▲ HDS ‘GAD’ 구성 방식 (자료: 효성인포메이션시스템)

HIS는 기업이 데이터를 빠르고 안전하게 보관할 수 있도록 다양한 백업 및 복구 솔루션을 제공할 뿐만 아니라, 데이터를 안전하게 유지할 수 있는 보안솔루션을 제공함으로써 차세대 백업환경을 구현하는 데에도 힘쓰고 있다. 로컬 디스크 간 백업에서부터 데이터를 원거리로 복제하는 방법에 이르기까지, 재난에 대처하는 효율적인 복구 방법 수립과 RTO/RPO 등을 극대화하기 위한 다양한 옵션들을 제공한다.

한편, HIS는 국내 최초로 12,000㎞ 거리의 미국 워싱턴과 서울을 연결하는 한·미 간 재해복구시스템도 구축한 바 있다. 이는 순수 국내 기술력으로 구축된 최장거리 백업 시스템으로서, 외교통상부는 전체 DB를 실시간으로 한국에서 미국으로 전송, 시스템 장애나 기타 재난 발생 시 백업 데이터를 미주센터에서 즉각 활용할 수 있다.


03 넷앱 | 스토리지 SW솔루션 ‘메트로클러스터’

넷앱은 엔터프라이즈와 하이브리드 클라우드 전체에서 데이터 및 비즈니스 크리티컬 애플리케이션을 보호하는 다양한 솔루션을 갖추고 있다. 넷앱의 데이터 보호 솔루션은 크게 ▲사내 백업 및 아카이빙 ▲DR ▲클라우드 통합형 백업 및 아카이빙 ▲사이트(site) 간 데이터보호 및 백업 등 4가지로 구성된다. 이 중 DR 부문의 대표적인 솔루션은 ‘메트로클러스터’와 ‘스냅미러’가 있다.

넷앱 ‘메트로클러스터’는 스토리지OS인 ‘클러스터드 데이터온탭(Clustered Data ONTAP)’의 SW 솔루션 중 하나로, 양 데이터센터에 구축된 스토리지 사이에서 실시간으로 데이터를 복제해 데이터센터 간 비즈니스 연속성과 무중단 운영을 보장한다. ‘플렉스어레이(FlexArray)’ SW를 함께 사용하면 타사 스토리지도 지원 가능하며, ‘스냅미러(Snap Mirror)’ SW를 추가하면 LAN/WAN 연결을 통해 원거리에서 데이터를 넷앱 스토리지로 고속 복제해 미러링할 수 있다. 

▲ 넷앱 ‘메트로클러스터’ 개념도 (자료: 넷앱)

대우건설은 넷앱의 ‘메트로클러스터’를 사용해 액티브-액티브 구성으로 4개의 노드에 데이터를 동시에 저장 및 관리하도록 구성했다. 하나의 데이터센터 혹은 노드에 장애가 발생하면, 다른 노드를 통해 장애 발생 전과 동일하게 데이터를 저장 및 관리하므로 안정적 운영이 가능하다.


04 베리타스 | 복구 과정 전반 관리, ‘베리타스 레질리언시플랫폼2.0’

베리타스는 데이터 보호에 관한 포괄적 포트폴리오를 보유하고 있다. DR 과정 전반을 관리하는 ‘베리타스 레질리언시플랫폼2.0’은 다양한 벤더 및 플랫폼의 프라이빗, 퍼블릭, 하이브리드 클라우드 환경 전반을 지원한다. 워크로드 마이그레이션, 페일오버, 페일백, 데이터 보호, 무중단 복구 테스트 등 모든 레질리언스(Resilience) 작업을 예측 가능한 방식으로 관리함으로써 기업들이 중요한 비즈니스 가동 시간을 유지할 수 있도록 한다. 

▲ 베리타스 ‘레질리언시플랫폼2.0’ 사용 화면 (자료: 베리타스)

‘베리타스 리스크어드바이저’는 리스크의 자동 탐지 및 우선순위 개선 지침 등의 리포팅 기능을 제공, 인프라를 최적화하고 다운타임을 최소화할 수 있도록 돕는다. 이로써 기업들은 데이터 유실을 방지하고 높은 가용성으로 비즈니스 연속성을 유지, DR 투자에 대한 혜택을 얻을 수 있다.

주력 제품인 ‘베리타스 넷백업 어플라이언스(Veritas NetBackup Appliance)’는 백업과 중복제거, 스토리지 기능을 하나의 장치에서 통합 제공함으로써 관리와 운영, 지원을 간소화한다. 특히, 자동 백업이미지 복제(Auto Image Replication, AIR)는 백업DR에 특화된 기능으로, 자동화 기반의 백업본 복제 및 카탈로그 생성을 담당한다.


05 퀀텀 | ‘DXi6900 시리즈’ 중복제거 백업 어플라이언스

디스크 기반 데이터 백업 어플라이언스인 ‘DXi6900’은 퀀텀의 ‘스토어넥스트5(StorNext 5)’ 기술과 ‘DXi’ SW를 기반으로 최적화된 성능과 확장성, 관리성을 제공한다. 

▲ 퀀텀 ‘DXi6900’

신속한 백업, 복구, 원격복제(Replication)가 특징으로 네트워크 대역폭 부하 및 전체 운영비용의 감소를 가능하게 한다. 라이선스 키를 간편하게 추가 구매해 17TB부터 510TB까지 규모를 확장할 수 있으며, 간단한 설정 마법사를 통해 멀티사이트(multisite) 데이터 보호가 가능하다. 이 밖에 세부적 리소스 활용 리포팅 등도 제공받을 수 있다.

퀀텀의 클라우드 기반 과금형 스토리지 서비스인 ‘Q-클라우드 보호 서비스(Q-Cloud Protect services)’와 함께 사용하면 클라우드 서비스를 통해 원격지에 주요 데이터를 안전하게 저장하고 관리할 수 있다.


06 아크서브 | 통합 데이터보호 솔루션 ‘아크서브 UDP’

▲ ‘아크서브 UDP SW패키지’
‘아크서브 UDP(Unified Data Protection)’는 SW 및 어플라이언스 형태의 솔루션으로 중복제거 백업, OS이미지백업, 블록/파일 복제, 서버 이중화, 테이프·VTL 아카이빙, 로컬 및 원격지 DR 등을 단일 콘솔에서 관리 가능하다.

‘아크서브 UDP’는 단일 어플라이언스에서 ▲레거시 백업 기능을 턴키(Turnkey) 형태로 제공 ▲백업 저장 공간 절감을 위한 중복제거(De-duplication) 어플라이언스 기능 ▲자동 페일오버 기능 ▲게이트웨이(Gateway) 어플라이언스로서 클라우드 저장소로 백업 이미지 복제 기능 등을 제공한다. 

박희범 아크서브코리아 상무는 “아크서브는 단지 데이터만이 아니라 OS, 애플리케이션, DB, 파일데이터 등을 포함한 전 시스템을 보호하고 장애가 발생했을 때는 복구까지 할 수 있다”고 설명했다.


07 맨텍 | HA/DR솔루션 ‘MCCS’, DR센터 운영·관리 자동화 솔루션 ‘MDRM’

맨텍은 1994년부터 외산 솔루션을 중심으로 서버 클러스터링 및 실시간 데이터 복제가 가능한 고가용성(HA) DR솔루션 사업을 시작했으며, 2007년에는 국산화에 성공했다. 또한, 맨텍은 2020년까지 이러한 솔루션의 대중화를 목표로 최근 ‘MCCS’를 오픈소스화 했다. 

▲ 맨텍 ‘MCCS’ 주요 기능 요약 (자료: 맨텍)

‘MCCS’는 서버 인프라의 장애 및 재해로 인한 서비스의 중단 가능성을 감시하고, 재해 시에는 자동 페일오버를 통해 서비스의 다운타임을 최소화하는 솔루션이다. 실시간 데이터 복제 기능도 지원, 치명적인 재해가 발생해도 데이터 손실 없이 즉각적인 복구가 가능하다. 국내에서는 다양한 산업군에서 1,000여개 이상의 기업 및 기관에 적용돼 중단 없는 비지니스 인프라 환경을 제공하고 있다.

또한, ‘MDRM’은 DR센터 운영과 관리의 자동화를 제공하는 솔루션이다. 주 전산센터와 DR센터 간의 데이터 일치 여부, 모의훈련을 통한 서비스 복구 가능성 체크, 재해 발생시 복구 매뉴얼에 따라 제시된 목표시간 내 인프라 복구 지원 등을 가능하게 한다. 

▲ 맨텍 ‘MDRM’ DR 워크플로우 구성 (자료: 맨텍)

GUI 기반으로 ▲복구절차 수립 ▲모의훈련 절차 제공 ▲복구흐름 및 단계의 가시성 제공 ▲복구가능성 및 데이터 복제 현황 모니터링 ▲복구와 원복의 원클릭 자동화 등을 제공, 치명적인 재해 시 목표 RPO 및 RTO를 준수할 수 있도록 지원한다.


08 아크로니스 | 빠른 OS 백업 강조, ‘아크로니스 백업12’

아크로니스는 물리, 가상, 클라우드, 모바일 등 통합적 데이터 환경에서 사용할 수 있는 백업·복구 솔루션을 제공한다. 제한된 IT인력과 비용으로 인해 DR에 많은 투자를 할 수 없는 중견·중소업체는 물론, 엔터프라이즈와 개인 소비자까지 폭넓게 시장을 공략하고 있다.

‘아크로니스 백업12’는 퍼블릭과 프라이빗 클라우드를 함께 사용하는 하이브리드 클라우드 IT 환경에 최적화된 솔루션으로 MS와 AWS, 안드로이드, iOS, 리눅스, VM웨어 등 15가지 플랫폼에서 데이터 백업을 지원한다. 

▲ ‘아크로니스 백업12’ 사용 화면 (자료: 아크로니스)

이로써 클라우드 및 온프레미스 시스템은 물론, 물리/가상 시스템 및 원격 시스템, 모바일 디바이스 등에 대한 종합적 데이터 보호가 가능하다. 아크로니스는 단 3번의 클릭으로 제품 설치를 끝낼 수 있으며, 경쟁 제품 대비 2배 빠른 속도로 15초 미만의 복구 속도를 보장한다는 점을 내세우고 있다.


09 컴볼트 | 백업·복구SW ‘데이터플랫폼’

컴볼트는 가트너 ‘매직 쿼드런트 데이터센터 백업·복구SW(Magic Quadrant for Data Center Backup and Recovery Software)’ 보고서에서 6년 연속 ‘리더(Leader)’로 선정된 백업·복구SW 전문 업체다. 올해 보고서에서 컴볼트는 비전 완성도와 실행 능력 면에서 모두 가장 높은 평가를 받았다. 

▲ 컴볼트 ‘데이터플랫폼’ 지원 환경 (자료: 컴볼트)

컴볼트 ‘데이터 플랫폼’은 ▲백업/복구 ▲아카이빙 ▲스냅샷(snapshot) ▲복제 ▲검색 ▲스토리지 자원 관리 등의 기능을 단일 SW솔루션으로 통합해 안정성, 모듈 간 호환성, 확장성을 물리 및 프라이빗, 퍼블릭 클라우드 환경 등에서 동일하게 제공한다.

특히, ‘인텔리스냅’ 기술을 통해 단일 환경에서 다양한 스토리지의 스냅샷을 관리할 수 있으며, 직관적인 모니터링 및 간편한 시점 복제본 재사용 관리가 가능하다. 레거시 인프라와 플래시, 컨버지드 및 하이퍼 컨버지드 인프라 등에 이르는 전체 환경을 지원한다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지