22일 오전 8시 19분부터 9시 43분까지 84분간 장애…AWS “DNS 서버 설정 오류”

 
[아이티데일리] 아마존웹서비스(AWS)가 제공하는 클라우드 서비스에 22일 오전 장애가 발생해 국내 유통, 게임, 암호화폐거래소 등의 웹사이트 및 모바일 앱 등에 사용자들이 접속을 할 수 없는 현상을 겪었다. 퍼블릭 클라우드, 특히 서비스형 인프라(IaaS) 시장에서 독보적인 점유율을 차지하고 있는 AWS의 이번 서비스 장애로 인해 기업들이 퍼블릭 클라우드의 실제 가용성 확보 문제에 대해 확실하게 대비해야 할 필요가 있다는 지적이 나온다. 

이번 장애는 22일 오전 8시 19분부터 9시 43분까지 84분간 지속됐으며, 한국지역에서만 발생한 것으로 나타났다. 11시 이후로는 대부분의 서비스가 정상화된 상태다.

AWS 클라우드를 기반으로 서비스를 운영하고 있는 기업 관계자들은 이날 오전 “AWS의 서울리전에서 DNS 문제로 장애가 발생한 것으로 보인다”며, “AWS와 정확한 원인을 파악하고 있다”고 설명했다. 이번 AWS 서버 장애로 인해 암호화폐거래소 업비트는 오전 8시 28분경부터 10시 32분까지 약 2시간 동안 서비스 장애가 발생했으며, 코인원도 8시 40분부터 10시까지 약 1시간 20분 동안 서비스가 중단됐다.

▲ 업비트 서비스 장애관련 공지사항

더불어 이번 장애로 인해 AWS 클라우드 기반으로 서비스를 제공하던 쿠팡, 배달의민족, 마켓컬리 등 유통사이트뿐만 아니라, 업비트, 코인원 등 암호화폐거래소, 스마일게이트 등 게임사이트의 서비스가 마비돼 해당 기업들은 물론, 이를 이용하는 사용자들도 불편을 겪었다.

AWS 측은 오후 4시경에야 “금일 AWS 서울 리전에서 일부 DNS 서버 설정 오류로 인해, EC2 인스턴스가 84분 동안 DNS 기능을 할 수 없었다. 설정 오류는 해결됐으며 서버는 정상적으로 작동되고 있다”는 입장만을 밝혔다.

문제를 겪은 기업 관계자들은 “이번 서비스 장애로 불편을 끼쳐 죄송하다”며, “이번과 같은 사고가 일어나지 않게 사고대응체계를 구축하겠다”고 말했다.

한편, 업계 전문가들은 이번 사태가 AWS에 전적으로 인프라를 의존하던 기업들에게 경종을 울린 것이라는 지적을 하고 있다. 한 국내 IT서비스 업체 관계자는 “이번에 장애를 겪은 기업들은 전체 인프라를 AWS에 올려 사용하면서 멀티리전 서비스를 활용하지 않았던 경우인 것으로 파악된다. 뿐만 아니라 해외 서비스라는 특성상 사고 발생 후 대응도 원활하지 못했다”면서, “비용이 많이 들더라도 AWS 글로벌 리전에 서비스를 분산해 이중화하거나, 멀티 클라우드 또는 하이브리드 클라우드 전략을 택한 업체들은 이번과 같은 사태가 발생해도 빠르게 대응할 수 있었을 것”이라고 강조했다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지