전산장비‘만’ 관리, 애플리케이션 각 부처에…안정성 검증된 낡은 장비 사용, 신기술 도입 뒷전

[컴퓨터월드] 지난해 9월 12일, 경주에서 발생한 대형 지진으로 인해 국민안전처의 홈페이지가 다운되는 상황이 발생했다. 국민안전처 홈페이지는 지진 발생 직후 사용자의 접속 폭주로 다운된 뒤, 세 시간이 지나도록 복구되지 않았다. 강도 높은 지진이라는 실제 재난 상황에서 제 역할을 하지 못한 국민안전처는 뒤늦게나마 홈페이지의 트래픽 처리 용량을 최대 80배까지 향상시켰다고 밝히며 재발 방지 의지를 보였다. 그러나 이 같은 노력이 무색하게도 국민안전처 홈페이지는 같은 달 19일 경주에서 발생한 지진에 또 먹통이 되고 말았다. 성능을 향상시켰다고 발표한 후 채 한 달도 되지 않은 시점이다.

▲ 지난해 9월, 경주 지진 발생으로 인해 국민안전처 홈페이지가 두 차례 다운됐다.

국민의 안전을 담보해야할 기관이 재난 상황에 연속으로 다운돼버리는 초유의 사태에 국민안전처는 물론 정부통합전산센터도 비상이 걸렸다. 지난해 11월, 정부통합전산센터는 자체적인 성능점검팀을 신설해 센터에 입주한 기관들의 시스템과 앱 성능을 점검하기 위해 팔을 걷어붙였다. 꾸준한 성능 점검과 모니터링을 통해 안정된 운영을 이어나가며, 이를 차차 확대해 전 부처의 대국민 시스템 성능 점검에 나서겠다는 방침이다.

그러나 정부통합전산센터의 대응에 각 부처는 회의적인 시선을 보내고 있다. 전문 팀을 꾸려서 성능 점검에만 신경 쓸 게 아니라, 근본적인 문제의 원인을 파악하고 해결해나가야 한다는 얘기다. 한 부처 관계자는 “트래픽 처리 성능만 향상시킨다고 해결될 문제가 아니다”라며, “재난 상황에 트래픽이 몰리는 국민안전처의 특성을 감안해, 트래픽이 몰릴 때 적합한 자원 분배가 이뤄질 수 있는 시스템을 갖춰야 한다”고 강조했다. 당장의 문제만 해결하려는 정부통합전산센터의 대응이 미봉책에 가깝다는 얘기다.

경주에서 발생한 지진으로 국민안전처 홈페이지가 다운됐을 때 해당 사태에 대해 강도 높은 비난을 받은 것은 정부통합전산센터가 아닌 국민안전처였다. 정부통합전산센터를 한 기업의 전산실에 빗대어 본다면, 트래픽 폭주로 해당 기업의 홈페이지가 다운된다면 일차적인 책임은 홈페이지 관리자가 아니라 트래픽 폭주에 대응할 수 있는 적절한 시스템을 갖추지 못한 전산실에 있다. 처음 한 번이야 트래픽 폭주를 예상하지 못해 시스템 구축이 미진했다고 하더라도 한 번 문제를 겪고 나면 빠르게 문제 조사에 나서고 재발 방지 대책을 세워야 한다. 그러나 현재 정부통합전산센터는 “우리는 장비만 관리할 뿐, 그 외의 문제 발생은 사용자가 질 일”이라며 책임을 회피하는 모습을 보이고 있다.


‘책임’ 없는 권한이 문제
이미 발생한 문제에 대해서도 제대로 된 해결책을 내놓지 않는 정부통합전산센터에 대해 각 부처와 관련 업계는 “이처럼 책임지지 않으려는 태도가 가장 큰 문제”라고 지적한다. 실제로 정부통합전산센터는 각 부처에서 발주한 장비를 반입하고 유지보수 할 책임만 있을 뿐, 그 위에서 구동되는 애플리케이션에 대해서는 해당 시스템을 사용하는 각 부처가 책임지고 관리해야 한다. 그러다보니 현장에서는 여러 문제들이 발생할 수밖에 없다. 장비 관리 측과 애플리케이션 관리 측의 업무가 업무적·물리적으로 분리돼 있다 보니 소통이 제대로 되지 않는 경우도 빈번히 발생한다.

한 부처에서는 필요한 장비가 있어 발주를 넣어도 정부통합전산센터가 묵살해버리는 경우가 빈번하다고 지적한다. 해당 부처 관계자에 따르면, 업무에 꼭 필요한 장비가 있어 신청을 넣어도 정부통합전산센터 측의 운영관리지침과 맞지 않다는 이유로 반입이 거절되는 경우가 많다는 것이다. 특히 외산 장비를 신청하는 경우 정부통합전산센터 측에서 제시하는 임의의 국산 장비, 즉 운영관리지침에 알맞은 장비로 바뀌는 경우도 있으며, 이 경우 시스템을 이전하는 동안 발생하는 문제에 대해서는 외면하는 태도를 보인다.

또한 기술의 발전으로 더 향상된 성능을 가진 장비가 도입될 경우, 정부통합전산센터 측에서 인수를 미루거나 거절하는 경우도 발생하고 있다. 한 정부 부처는 새로이 도입한 장비를 정부통합전산센터 측에서 인수해주지 않아, 장비를 반입해놓고도 책임 소재는 부처가 지고 있는 기형적인 구조가 일 년 이상 유지되기도 했다. 물론 인수절차를 거치지 않은 장비에서 문제가 발생하면 정부통합전산센터는 어떤 책임도 없다.

올바른 절차대로라면 신규 장비 도입 시 몇 주 간의 테스트 절차를 거치게 돼 있고, 이 검증 절차를 통과하면 정부통합전산센터가 인수해 관리 책임을 도맡아야 하는 것이 맞다. 그러나 실제로는 충분한 시간이 지나 운영이 안정화되고 문제 발생 여지가 없다고 생각될 때까지 인수를 미루는 관행이 빈번히 일어나고 있다.

이렇게 늑장 대처를 하는 데는 정부통합전산센터가 제시하는 ‘운영관리지침’이 한 몫을 거들고 있다. 각 부처 및 관계기관은 필요로 하는 장비를 도입할 때 정부통합전산센터가 운영관리지침을 통해 제시하는 제품을 우선적으로 고려해야 한다. 그러나 이 운영관리지침 역시 빠른 IT기술의 발전을 따라가지 못하고, 이미 수 년 동안 운영돼 안정성이 검증된 낡은 시스템만을 권장하고 있다. 사정이 이렇다보니 각 부처 차원에서는 어플라이언스(Appliance) 장비 등 기존에 도입된 적이 없는 장비를 얻어내기 위해 정부통합전산센터와 부질없는 기 싸움을 벌여야 한다.


엄격한 평가 기준이 유기적인 업무 방해해
정부통합전산센터의 ‘책임지지 않으려는 태도’에는 해당 기관에 내려지는 평가 체계에 근본적인 원인이 있다. 정부통합전산센터 및 해당 기관의 직원들에게 내려지는 엄격한 평가 기준 때문에, 이미 낡은 장비와 시스템도 안정성이 검증됐다는 이유로 거부감 없이 도입하고 있다는 얘기다.

전산 서비스를 업그레이드해 나가면서 동시에 무중단 운영을 유지하는 것은 매우 어렵다. 향상된 성능을 위해 새로운 장비·시스템을 도입했다가 예상치 못한 장애로 서비스가 중단되는 것은 충분히 일어날 수 있는 일이며, 관리 주체 입장에서는 빠른 서비스 복구와 원인 규명에 집중해 같은 문제가 재발하지 않도록 노력하면 된다. 그러나 만약 관리 주체를 평가 기준이라는 족쇄로 옭아매버린다면, 문제 발생 시 조금이라도 자신의 책임을 덜어내기 위한 방법을 찾게 될 것이다. 정부통합전산센터 역시 장비 도입 종류를 제한하고, 관리 영역을 장비만으로 한정하며, 신규 기술의 도입에 난색을 표하는 등 책임 소재를 줄이려 들고 있다.

엄격한 평가 기준은 앞서 얘기됐던 미봉책 남발이라는 문제와도 일맥상통하며, 정부통합전산센터의 불필요하게 많은 업무 처리 절차를 만든 이유가 됐다. 한 정부 부처 관계자는 “절차 따라 가다보면 장비에 꽂는 랜선 하나 교체하는 데 6개월씩 걸리기도 한다”고 말했다. 랜선 교체라는 간단한 업무를 처리하기 위해 보안팀, 운영팀, 네트워크팀, 유지관리 업체 등 절차에 따라 다양한 그룹과 협의해야 하기 때문이다. 각 부처 대면 창구를 일원화하지 않고 업무를 담당하는 팀과 절차를 세부적으로 분류해 정부통합전산센터 내의 직원끼리도 서로 책임소재 나누기를 하고 있는 것으로 보인다.

정부통합전산센터에 산적한 문제들은 어제오늘의 일이 아니다. 오랫동안 유지되면서 쌓인 관행과 올바른 체계 없이 눈앞의 장애 해결에만 급급하게 만든 정부 시스템이 키워온 것이다. 제3정부통합전산센터 완공이 목전으로 다가온 지금, 당장의 책임 회피를 위해 눈을 돌리기보다 올바르게 문제를 인식하고 개선해나가려는 움직임을 보여야 할 때다.

<자세한 내용은 컴퓨터월드 3,4월호 참고>

저작권자 © 아이티데일리 무단전재 및 재배포 금지