직접 수냉 방식 기술 갖춰 효율·성능 최적화…대규모 AI 클러스터 구축 지원
[아이티데일리] HPE는 엔비디아 블랙웰(NVIDIA Blackwell) 기반 첫 번째 솔루션인 엔비디아 ‘GB200 NVL72’를 공식 출하한다고 20일 밝혔다. 랙 스케일(rack-scale) 시스템으로써 서비스 제공기업(SP)과 대기업이 첨단 직접 수냉 방식(DLC) 솔루션을 통해 효율성과 성능을 최적화하며, 복잡한 대규모 인공지능(AI) 클러스터를 신속하게 구축할 수 있도록 지원한다.
이번 발표된 HPE 기반 엔비디아 GB200 NVL72는 고속 엔비디아 NV링크(NVLink)를 통해 상호 연결된 72개의 엔비디아 블랙웰 GPU 및 36개의 엔비디아 그레이스(Grace) CPU가 탑재된다. 또 최대 13.5TB에 달하는 HBM3e 메모리 및 초당 576TB 대역폭을 지원한다. HPE의 최신 DLC 기술도 적용된다.
HPE 트리시 댐크로거(Trish Damkroger) HPC 및 AI 인프라 솔루션 부문 수석 부사장은 “AI 서비스 제공기업과 대기업 모델 개발자들은 확장성, 최상의 성능, 빠른 구축 속도를 제공해야 한다는 엄청난 압박을 받고 있다”며 “DLC를 통해 세계 3대 최고속 시스템을 구축한 HPE는 업계 최고의 서비스 전문성으로 고객에게 토큰당 학습 비용을 낮추고 동급 최고의 성능을 제공한다”고 강조했다.
엔비디아 GB200 NVL72는 하나의 메모리 공간에서 1조 개 이상의 파라미터로 구성된 초대규모 AI 모델을 처리할 수 있도록 설계된 GPU 기술과 공유 메모리 및 저지연 아키텍처를 갖추고 있다.
또한 엔비디아의 CPU, GPU, 컴퓨트 및 스위치 트레이, 네트워킹, 소프트웨어(SW)를 통합해, 엔비디아 SW 애플리케이션과 함께 생성형 AI 모델 학습 및 추론과 같은 병렬화 가능한 워크로드를 처리할 수 있는 성능을 제공한다.
엔비디아 밥 페트(Bob Pette) 엔터프라이즈 플랫폼 부문 부사장은 “엔지니어, 과학자, 연구원들은 증가하는 전력과 컴퓨팅 요구사항을 따라잡기 위해 최첨단 수냉 기술이 필요하다”며 “HPE와 엔비디아 간의 지속적인 협업을 바탕으로, HPE의 첫 번째 엔비디아 GB200 NVL72 출하는 서비스 제공기업들과 대기업들이 대규모 AI 클러스터를 효율적으로 구축하고 배포하며 확장할 수 있도록 도울 것”이라고 말했다.
전력 요구사항 및 데이터센터 집적도의 증가에 따라, HPE는 50년간 쌓아온 수냉 전문 지식을 바탕으로 고객이 복잡한 수냉 환경에 대해 신속한 구축과 광범위한 인프라 지원 시스템을 제공할 수 있도록 지원하고 있다. 이러한 경험을 바탕으로 HPE는 세계에서 가장 에너지 효율적인 슈퍼컴퓨터를 선정하는 그린500(Green500) 리스트의 상위 15개 슈퍼컴퓨터 중 8대를 제공했다는 설명이다.
또한 HPE는 DLC 기술 분야에서 선도기업으로 인정받으며, 세계에서 가장 빠른 슈퍼컴퓨터 상위 10개 중 7대를 구축한 바 있다.


