[단독] “이격만 했어도” 국정자원 시스템, 이중화했지만 같은 존에 있었다
형식적 이중화 지적, DR·데이터 분산 모두 부재
[아이티데일리] 지난 9월 26일 국가정보자원관리원(국정자원) 대전 본원 화재를 계기로 정부 시스템의 이중화 실태가 도마 위에 올랐다. 국정자원 시스템은 이중화가 돼 있었지만, 정작 동일한 건물에 몰아넣어 화재로 인해 동시에 피해를 봤다는 업계 전문가들의 지적이 나왔다.
같은 건물, 층만 달라선 화재에 무력
이중화란 웹 애플리케이션 서버(WAS), 데이터베이스(DB) 서버 등 핵심 자원을 최소 2대 이상 구성해 장애 발생 시에도 서비스를 유지하는 것을 의미한다. IT 인프라 전문가들은 이중화의 핵심을 ‘이격’이라고 강조했다. 최소한 이중화된 자원을 다른 건물, 가능하면 다른 지역으로 분리해야 한다는 설명이다.
문제는 국정자원의 이중화된 자원들이 같은 전산실 및 같은 건물 다른 층에 위치해 있어 화재에 그대로 노출됐다는 점이다. 업계에서는 전원 이중화와 관리의 편의성을 위해 같은 건물 내에 배치했을 것으로 추측했다.
한 업계 관계자에 따르면 “여전히 많은 기관과 기업이 같은 전산실이나 같은 건물 내 층만 달리해서 이중화를 구축한다”며 “DB 서버나 AP 서버 등 역할별 자원을 한 공간 안에 두면 구조가 단순해지고, 구축 과정에서 혼선을 줄일 수 있다”고 설명했다. 또한 같은 공간에서 동시에 장애가 발생하거나 재난이 발생할 확률이 낮을 것이라는 인식도 한몫한다고 덧붙였다. 화재 당시 메인 장비와 이격돼 있어야 할 백업 스토리지가 같은 공간에 있었다는 증언도 나왔다.
‘액티브-스탠바이’라도 갖췄어야, 업계 아쉬움 토로
재해복구(DR) 체계가 제대로 작동하지 않은 부분도 비판점으로 지목된다. 전문가들은 “액티브-액티브(Active-Active) 구조를 갖추는 건 현실적으로 어렵더라도, 액티브-스탠바이(Active-Standby) 방식만 제대로 갖춰졌다면 몇 시간 내 서비스를 재개할 수 있었을 것”이라고 지적했다.
액티브-액티브 구조는 서버나 네트워크 장비 등 여러 개의 시스템이 동시에 운영되면서 부하를 분산 처리하는 구조를 뜻한다. 액티브-액티브의 경우 두 센터가 동시에 같은 데이터를 같은 속도로 처리해야 하므로 이를 실시간으로 맞춰줄 초고속 회선·네트워크 설계, 전문 인력 등이 필요하다. 높은 비용이 수반되며, 운영 난도도 높아 현실적으로 적용하기 어려운 방식으로 꼽힌다.
액티브-스탠바이 구조는 하나는 운영용, 다른 하나는 대기용으로 구성된다. 운영용 시스템에 장애가 발생할 시 대기 시스템으로 전환해 복구하는 방식이다. 액티브-액티브보다 복구 속도는 느리지만 비용이 더 저렴하다는 장점이 있다. 금융권에서도 핵심 시스템을 보호하기 위해 이 방식이 주로 활용된다.
한편 업계 관계자들은 “DR이 안 갖춰졌어도 데이터를 3중 복제해 지역별로 분산해 놓았다면 빠르게 복구할 수 있었을 것이다”고 말했다. 글로벌 클라우드 사업자들은 기본적으로 데이터를 3중 이상 복제하며, 이 중 한 개는 최소 100킬로미터(㎞) 이상 떨어진 다른 권역에 위치하도록 설계한다고 지적했다.