엔비디아, 日 소프트뱅크와 협업…‘블랙웰’ 기반 AI 슈퍼컴퓨터 구축 추진

AI-RAN 솔루션 ‘아이트라스’ 확산에도 박차

2024-11-13     한정호 기자

[아이티데일리] 엔비디아(CEO 젠슨 황)는 ‘엔비디아 AI 서밋 재팬(NVIDIA AI Summit Japan)’에서 일본 소프트뱅크(SoftBank)와 협업한다고 13일 밝혔다. 일본의 소버린 AI 이니셔티브를 가속화하고 글로벌 기술 리더십 강화를 지원한다는 계획이다.

엔비디아 젠슨 황(Jensen Huang) CEO는 행사 기조연설에서 “소프트뱅크가 엔비디아 ‘블랙웰(Blackwell)’ 플랫폼을 사용해 일본에서 가장 강력한 AI 슈퍼컴퓨터를 구축하고 있다”고 말했다. 또한 차기 슈퍼컴퓨터에 엔비디아 그레이스(Grace) 블랙웰 플랫폼을 활용할 계획이라고 발표했다.

엔비디아가 소프트뱅크와의 협업을 발표했다.

아울러 엔비디아는 소프트뱅크가 엔비디아 AI 에리얼(Aerial) 가속 컴퓨팅 플랫폼을 사용해 세계 최초로 AI와 5G 통신 네트워크를 결합한 시범 서비스에 성공했다고 소개했다. 뿐만 아니라 소프트뱅크는 엔비디아 AI 엔터프라이즈(Enterprise) 소프트웨어(SW)를 사용해 로컬 보안 AI 컴퓨팅에 대한 수요를 충족할 수 있는 AI 마켓플레이스를 구축할 계획이다. 소프트뱅크는 AI 훈련과 엣지 AI 추론을 지원하는 새로운 서비스를 통해 일본의 산업, 소비자, 기업 전반에 걸쳐 AI 서비스의 생성·배포·사용을 위한 새로운 비즈니스 기회를 촉진할 방침이다.

젠슨 황 CEO는 “일본은 전 세계에 영향을 미치는 기술 혁신을 선도해 온 오랜 역사를 갖고 있다. 소프트뱅크가 엔비디아의 풀스택 AI, 옴니버스(Omniverse), 5G AI-RAN 플랫폼에 대한 막대한 투자를 통해 일본은 AI 산업 혁명의 글로벌 리더로 도약하고 있다. 일본은 통신, 교통, 로보틱스, 의료 산업 전반에 걸쳐 새로운 성장의 시대를 주도해 AI 시대에 인류에게 큰 혜택을 제공할 것”이라고 말했다.

소프트뱅크 미야카와 준이치(Junichi Miyakawa) CEO는 “전 세계 국가와 지역이 사회와 경제 성장을 위해 AI 도입을 가속화하고 있으며, 사회는 중대한 변화를 겪고 있다. 소프트뱅크는 엔비디아와의 오랜 협력을 통해 이러한 변화를 최전선에서 주도하고 있다. 매우 강력한 AI 인프라와, AI를 위한 5G 네트워크를 재창조하는 새로운 분산형 AI-RAN 솔루션 ‘아이트라스(AITRAS)’를 통해 일본 전역과 전 세계에서 혁신을 가속화할 것”이라고 말했다.

이번 협력 발표로 소프트뱅크는 엔비디아 DGX B200 시스템을 공급받을 예정이다. 또 자체 생성형 AI 개발과 AI 관련 사업뿐만 아니라 일본 전역의 대학, 연구 기관, 기업에서 블랙웰 기반 DGX 슈퍼팟(SuperPOD)을 사용할 계획이다.

소프트뱅크는 추가적인 엔비디아 그레이스 블랙웰 플랫폼 설계 기반 가속 슈퍼컴퓨터 구축 계획도 갖고 있다. 엔비디아 블랙웰 GPU와 전력 효율이 뛰어난 Arm 기반 엔비디아 그레이스 CPU를 결합한 엔비디아 GB200 NVL72 멀티노드 수냉식 랙 스케일 시스템을 주축으로 갖출 계획이다.

무엇보다 소프트뱅크는 엔비디아와 협력해 구축한 AI-RAN 기술에 대해 큰 기대를 지니고 있다. 엔비디아와 소프트뱅크는 통신 사업자가 새로운 AI-RAN 인프라에 1달러의 자본을 투자할 때마다 약 5달러의 AI 추론 수익을 얻을 수 있을 것으로 예상하고 있다. 운영 비용과 자본 비용을 고려할 때, 소프트뱅크는 인프라에 추가하는 모든 AI-RAN 서버에 대해 최대 219%의 수익을 달성할 수 있을 것으로 예상 중이다.

실제 소프트뱅크는 AI-RAN 실증 과정에서 엔비디아 AI 엔터프라이즈를 활용해 자율주행 자동차 원격 지원, 로보틱스 제어, 엣지에서의 멀티모달 검색 자동 생성 등을 포함한 AI 추론 애플리케이션을 구축했다는 설명이다. 소프트뱅크의 AI-RAN 솔루션 실증에는 엔비디아 외에도 후지쯔(Fujitsu)와 레드햇(Red Hat)이 참여했다.

소프트뱅크는 엔비디아 AI 엔터프라이즈 서버리스 애플리케이션 프로그래밍 인터페이스와 자체 개발한 오케스트레이터(orchestrator)를 사용해 AI 기술의 수요와 공급을 연결하는 생태계 구축을 목표로 하고 있다. 이를 통해 컴퓨팅 리소스를 사용할 때 외부 AI 추론 작업을 AI-RAN 서버로 전송해 로컬라이즈된 저지연 보안 추론 서비스를 제공한다는 방침이다.

엔비디아 로니 바시스타(Ronnie Vasishta) 통신 담당 수석 부사장은 “단일 목적에서 다목적 AI-RAN 네트워크로 전환하면 투자한 1달러당 5배의 수익을 얻을 수 있다. 소프트뱅크의 실시간 실외 실험은 기술 실현 가능성, 성능, 경제성을 검증함으로써 AI-RAN 상용화를 향한 큰 발걸음을 내디딘 것”이라고 말했다.

소프트뱅크 와키카와 류지(Ryuji Wakikawa) 첨단기술연구소장은 “소프트뱅크의 아이트라스는 엔비디아와 5년간의 협업을 통해 개발된 최초의 AI-RAN 솔루션이다. 이 솔루션은 소프트뱅크가 개발한 오케스트레이터를 통해 AI와 RAN 워크로드를 통합, 조정하며, 단일 엔비디아 가속 GPU 서버에서 고밀도 셀을 실행해 통신 효율성을 향상시킨다. 우리는 이 AI 기반 혁신인 아이트라스가 통신 분야의 새로운 비즈니스 모델을 위한 길을 열어 모바일 사업자 혁신에 중요한 역할을 할 것으로 확신한다”고 강조했다.