GPU 발열 대응·전력 효율 개선, 2030년까지 500㎿ 규모 확보 목표
[아이티데일리] 그래픽처리장치(GPU)의 높은 발열이 안정적 AI 인프라 마련을 위한 해결 과제로 떠오른 가운데 KT클라우드(대표 최지웅)가 액체 냉각(리퀴드 쿨링, Liquid Cooling) 기술을 적용한 데이터센터를 개소했다.
6일 KT클라우드는 상업용 데이터센터 ‘가산 AI 데이터센터’를 개소했다고 밝혔다.
리퀴드 쿨링 적용한 AI DC
가산 AI 데이터센터는 연면적 약 1만 1,046평, 지하 5층·지상 10층 규모로 조성됐다. 총 수전 용량은 40메가와트(㎿), IT 용량은 26㎿, 2,700개의 랙을 수용할 수 있는 규모다. 구조를 살펴보면 △서버실 5개층 △UPS(무정전전원공급장치)실 1개층 △비상 발전기실 2개층 △전기실 2개층 등으로 구성된다.
가산 AI 데이터센터는 공랭식과 수랭식을 겸용한다. 특히 이번에 적용된 리퀴드 쿨링 기술은 고성능 그래픽처리장치(GPU) 칩에 콜드 플레이트를 부착하고 냉수를 직접 접촉시키는 D2C(직접 칩 냉각, Direct to Chip) 방식을 기반으로 한다. KT클라우드는 엔비디아 B200 등 최신 GPU를 바탕으로 AI 서버의 고열 환경을 테스트하고, 제어하기 위한 리퀴드 쿨링 부하기를 자체 개발해 성능 검증을 완료한 상황이다.
KT클라우드 최지웅 대표는 “GPU의 연산 성능이 높아질수록 발열이 심해져 내구성의 문제로 GPU를 2~3년밖에 사용을 못하는 구조”라며 “리퀴드 쿨링은 고성능 AI 서버의 안정적 운영을 위한 핵심 인프라 기술로, 이번 도입은 장기적 관점에서 지속 가능한 AI 데이터센터 환경을 구축하기 위한 KT클라우드의 전략적 선택”이라고 설명했다.
가산 AI 데이터센터 옥상에는 IT·유틸리티용 패널 유닛 공조기가 배치됐으며, 프리쿨링 방식으로 냉수를 공급한다. 냉동기 냉매와 응축기 사용을 최소화해 냉방 부하를 줄였다. UPS는 배터리와 분리돼 있으며, 전원 장애 시 1분 이내 비상 전력으로 전환된다. 배터리는 리튬인산철을 사용해 화재 안전성을 높였다. 각 배터리 모듈에는 기체 소화 약재가 내장돼 있어 단위 모듈에서 즉시 진화가 가능하며, 실 부하 30% 기준 약 1시간의 백업 전원 공급이 가능하다.
비상발전기실에는 3,000킬로볼트암페어(kVA)급 특고압 수배전 설비 16대(N+1 구조)가 설치돼 장시간 안정적 전력 공급이 가능하다. 또한 안정적 유류 공급을 위해 인근 주유소와 연계 계약도 진행한 것으로 나타났다.
데이터센터의 두뇌 역할을 하는 종합상황실은 주·야간 24시간 체제로 운영되며, 전력·보안·기계 설비를 통합 모니터링한다. KT클라우드는 자체 개발을 통해 특허 등록을 완료한 ‘패스 파인더(Path Finder)’ 솔루션을 가산 AI 데이터센터에 도입했으며, 이를 통해 전력 계통을 실시간으로 모니터링하고, 자동 차단과 복구 등을 수행할 수 있다.
‘자동화 운영 플랫폼(DIMS)’의 경우 AI 분석을 기반으로 장애를 사전에 예측하고, 발생 상황을 자동 분류해 즉각적이고 정밀한 대응이 가능하다. KT클라우드는 DIMS를 학습 데이터를 기반으로 고도화해 운용 품질을 개선했다고 밝혔다.
통합형 턴키 AI 인프라 서비스 선봬
KT클라우드는 가산 AI 데이터센터를 통해 ‘콜로닷AI(Colo.AI)’ 서비스를 본격적으로 제공한다는 방침이다. 이 서비스는 고객 맞춤형 GPU 서버, 전용 네트워크, 운영 플랫폼, 유지보수까지 모두 포함된 통합형 턴키 AI 인프라 서비스다.
최 대표는 “엔비디아 B200 클러스터를 만들어 고객에게 제공할 것”이라며 “온디맨드 클라우드를 사용하는 이유는 초기 불확실성에 따른 리스크를 최소화하기 위함인데, 콜로닷AI도 마찬가지로 한 달 단위로 서비스를 구독할 수 있으며 필요 없어지면 구독을 끊기만 하면 되는 구조라고 설명했다. 우리는 데이터센터 인프라부터 통신까지 다루기 때문에 이런 부분들을 잘 활용할 수 있다는 게 장점이라고 강조했다.
한편 최 대표는 “오는 2030년까지 320㎿ 수준의 데이터센터를 확보하겠다고 밝힌 바 있는데 중간에 전략을 수정해 500㎿로 목표를 수정했다”며 “2027년까지 한 해에 거의 60~100㎿씩 순차적으로 오픈하고 있다”며 “향후 개소될 안산, 하남 센터 등을 위한 부지 선정, 수전 확보 등도 단계적으로 밟아나가고 있는 상황”이라고 밝혔다.
이어 그는 “가산 AI 데이터센터가 국내 AI 산업 생태계 활성화의 전환점이 되길 바란다”며 “KT클라우드는 가산을 시작으로 서부권역을 포함한 국내 주요 거점에 500㎿ 이상 대규모 인프라를 중장기적으로 확보해 AX 대전환을 선도해 나갈 것”이라고 말했다.


