슈퍼컴퓨팅 인프라부터 소프트웨어, 제공 서비스까지 발표

[아이티데일리] 아마존웹서비스(AWS)와 엔비디아(NVIDIA)는 고객의 인공지능(AI) 혁신을 지원하는 최첨단 인프라와 소프트웨어(SW), 서비스를 제공하기 위해 전략적 협력을 확대한다고 1일 밝혔다.

양사는 차세대 GPU, CPU, AI 소프트웨어를 갖춘 엔비디아의 최신 멀티노드 시스템부터 AWS 니트로 시스템(AWS Nitro System) 고급 가상화 및 보안, 엘라스틱 패브릭 어댑터(Elastic Fabric Adapter; EFA) 상호 연결, 울트라클러스터(UltraCluster) 확장성까지, 파운데이션 모델(FM) 학습과 생성형 AI 애플리케이션 구축에 이상적인 엔비디아와 AWS의 기술들을 결합할 계획이다.

이번 협력 확대는 초기 머신러닝(ML) 선도 기업들에게 최첨단 기술을 발전시키기 위해 필요한 컴퓨팅 성능을 제공함으로써, 생성형 AI 시대를 촉진해 온 양사의 오랜 파트너십을 기반으로 한다는 설명이다.

이번 협력의 일환으로, 먼저 AWS는 새로운 멀티노드 NV링크(NVLink) 기술이 적용된 엔비디아 ‘GH200 그레이스 호퍼 슈퍼칩(NVIDIA GH200 Grace Hopper Superchip)’을 클라우드에 도입할 예정이다. 엔비디아 GH200 NVL32 멀티노드 플랫폼은 32개의 그레이스 호퍼 슈퍼칩과 엔비디아 NV링크 및 NV스위치(NV Switch) 기술을 하나의 인스턴스로 연결한다. 해당 플랫폼은 아마존의 네트워킹(EFA)과 연결된 아마존 EC2 인스턴스에서 사용할 수 있으며, AWS 니트로 시스템 및 아마존 EC2 울트라클러스터을 지원해 고객은 GH200 슈퍼칩을 수천 개까지 확장할 수 있다.

다음으로 엔비디아와 AWS는 협업을 통해 엔비디아의 서비스형 AI 트레이닝인 ‘엔비디아 DGX 클라우드(NVIDIA DGX Cloud)’를 AWS에서 호스팅할 계획이다. 이는 GH200 NVL32를 탑재한 최초의 DGX 클라우드로, 개발자에게 단일 인스턴스에서 가장 큰 공유 메모리를 제공할 수 있다. AWS 상의 DGX 클라우드는 1조 개 이상의 파라미터에 달하는 최첨단 생성형 AI 및 대규모 언어 모델(LLM)의 학습을 가속화할 것이라는 게 회사 측 설명이다.

또한 양사는 ‘프로젝트 세이바(Project Ceiba)’에서 협력해 엔비디아의 자체 연구 개발팀을 위해 AWS가 호스팅하는 GH200 NVL32 및 아마존 EFA 인터커넥트를 갖춘 대규모 AI 슈퍼컴퓨터 시스템을 설계하고 있다. 16,384개의 엔비디아 GH200 슈퍼칩을 탑재하고 65 엑사플롭의 AI를 처리할 수 있는 슈퍼컴퓨터는 엔비디아가 차세대 AI 혁신을 추진하는 데 활용될 전망이다.

아울러 AWS는 아마존 EC2 인스턴스 3종을 추가로 도입할 예정이다. △대규모 최첨단 생성형 AI 및 HPC 워크로드를 위한 엔비디아 H200 텐서 코어(Tensor Core) GPU 기반의 P5e 인스턴스 △AI 미세 조정, 추론, 그래픽, 비디오 워크로드와 같은 광범위한 애플리케이션을 위한 엔비디아 L4 GPU 기반 G6 인스턴스 △동일 용도의 엔비디아 L40S GPU 기반 G6e 인스턴스 등이다. 특히 G6e 인스턴스는 생성형 AI 지원 3D 애플리케이션을 연결하고 구축하기 위한 플랫폼인 엔비디아 옴니버스(NVIDIA Omniverse)를 사용해 3D 워크플로우, 디지털 트윈 및 기타 애플리케이션을 개발하는 데 적합하다.

AWS 아담 셀립스키(Adam Selipsky) CEO는 “AWS와 엔비디아는 세계 최초의 GPU 클라우드 인스턴스를 시작으로 13년 이상 협력해 왔다. 오늘날 양사는 그래픽, 게임, 고성능 컴퓨팅, ML, 그리고 이제 생성형 AI를 포함한 워크로드를 위한 가장 광범위한 엔비디아 GPU 솔루션을 제공하고 있다”며 “우리는 차세대 엔비디아 그레이스 호퍼 슈퍼칩과 AWS의 강력한 네트워킹, EC2 울트라클러스터의 하이퍼스케일 클러스터링, 니트로의 고급 가상화 기능을 결합함으로써 AWS를 GPU를 실행하기 가장 좋은 곳으로 만들기 위해 엔비디아와 함께 혁신을 지속하고 있다”고 말했다.

엔비디아 젠슨 황(Jensen Huang) CEO는 “생성형 AI는 클라우드 워크로드를 혁신하고 가속 컴퓨팅을 다양한 콘텐츠 생성의 기반으로 삼고 있다”며 “모든 고객에게 비용 효율적인 최첨단 생성형 AI를 제공한다는 공동의 사명을 바탕으로, 엔비디아와 AWS는 AI 인프라, 가속 라이브러리, 기반 모델, 생성형 AI 서비스에 이르는 전체 컴퓨팅 스택에 걸쳐 협력하고 있다”고 밝혔다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지