엔비디아, MS와 오픈AI에 블랙웰 시스템 최초 공급
블랙웰 슈퍼칩 기반 AI 인프라 구축
[아이티데일리] 엔비디아(NVIDIA)는 마이크로소프트(MS)와 오픈AI(OpenAI)에 ‘블랙웰(Blackwell)’ 시스템을 최초로 공급한다고 11일 밝혔다.
이번 공급으로 MS 애저(Microsoft Azure)는 GB200 기반 AI 서버를 갖춘 엔비디아 블랙웰 시스템을 구동하는 최초의 클라우드 솔루션 제공업체(CSP)가 됐다. MS 애저는 인피니밴드(Infiniband) 네트워킹과 폐쇄 루프 액체 냉각을 활용해 고성능 AI 모델을 구동할 수 있도록 모든 단계의 최적화를 진행하고 있다.
MS 사티아 나델라(Satya Nadella) CEO는 공식 소셜미디어 X를 통해 “우리는 엔비디아와의 오랜 파트너십과 심층적인 혁신으로 업계를 선도하며 가장 정교한 AI 워크로드를 지원하고 있다”고 말했다.
GB200 그레이스(Grace) 블랙웰 슈퍼칩은 엔비디아 GB200 NVL72의 핵심 구성 요소다. GB200 NVL72는 72개의 블랙웰 GPU와 36개의 그레이스 CPU를 연결하는 멀티 노드, 수냉식, 랙 스케일 솔루션이다. 이는 거대언어모델(LLM) 워크로드에 최대 30배 빠른 추론을 제공하며, 수조 개의 파라미터 모델을 실시간으로 실행할 수 있는 기능을 제공한다.
아울러 엔비디아는 오픈AI에 블랙웰 DGX B200의 첫 엔지니어링 샘플 중 하나를 제공했다. 오픈AI는 최신 DGX B200 플랫폼을 통한 AI 훈련에 엔비디아 블랙웰 B200 데이터센터 GPU를 활용할 계획이다. 엔비디아는 공식 X 계정읕 통해 오픈AI에 전달한 DGX B200의 모습을 공개했다.
엔비디아 DGX B200 시스템은 AI 모델 훈련, 미세 조정, 추론을 위한 통합 AI 슈퍼컴퓨팅 플랫폼이다. 5세대 엔비디아 NV링크(NVLink)로 상호 연결된 8개의 블랙웰 GPU를 탑재해 이전 세대인 DGX H100 대비 3배의 훈련 성능과 15배의 추론 성능을 제공한다.