AI 추론 워크로드 가속화 위한 맞춤형 인프라 설계 제공, 각 업체들 이달 본격 제품 출시

[아이티데일리] 엔비디아(NVIDIA, CEO 젠슨 황)가 19일 미국 새너제이에서 열린 GTC 2025에서 주요 스토리지 기업들과 협력해 기업의 AI 추론 워크로드를 가속화하는 맞춤형 인프라 설계인 ‘엔비디아 AI 데이터 플랫폼(NVIDIA AI Data Platform)’을 공개했다.

이번에 발표된 엔비디아 AI 데이터 플랫폼은 엔비디아의 가속 컴퓨팅 기술과 네트워킹, 소프트웨어를 기반으로 구축됐다. 특히 엔터프라이즈 스토리지 플랫폼에 특화된 AI 쿼리 에이전트를 지원해, 기업이 데이터를 실시간에 가깝게 분석하고 인사이트를 도출할 수 있도록 돕는다.

엔비디아 인증 스토리지(NVIDIA-Certified Storage) 공급업체들은 이 플랫폼을 활용해 AI 추론 워크로드를 위한 인프라를 구축할 예정이다. 이때 사용되는 AI 쿼리 에이전트는 엔비디아 ‘라마 네모트론(Llama Nemotron)’ 모델의 추론 기능을 지원하는 NIM 마이크로서비스와, 새로운 엔비디아 ‘AI-Q 블루프린트(AI-Q Blueprints)’를 포함하는 엔비디아 AI 엔터프라이즈 소프트웨어를 기반으로 구동된다.

엔비디아가 주요 스토리지 기업들과 협력해 기업의 AI 추론 워크로드를 가속화하는 맞춤형 인프라 설계인 ‘엔비디아 AI 데이터 플랫폼(NVIDIA AI Data Platform)’을 공개했다.

엔비디아 창립자인 젠슨 황(Jensen Huang) CEO는 “데이터는 AI 시대의 핵심 원료”라며 “세계적인 스토리지 선도기업들과 협력해 기업들이 하이브리드 데이터센터에서 에이전트 AI를 구축하고 확장하는 데 필요한 새로운 인프라를 개발하고 있다”고 강조했다.

엔비디아 AI 데이터 플랫폼은 ‘블랙웰(Blackwell)’ GPU, ‘블루필드(BlueField)’ DPU, ‘스펙트럼-X(Spectrum-X)’ 네트워킹 등 최신 기술을 활용한다. 특히 블루필드 DPU는 기존 CPU 기반 스토리지 대비 최대 1.6배 높은 성능과 전력 소비를 최대 50% 절감하는 효과를 제공하며, 스펙트럼-X 네트워킹은 기존 이더넷 대비 최대 48% 빠른 속도로 AI 데이터 접근을 가속화한다.

또한 엔비디아 AI-Q 블루프린트는 ‘네모 리트리버(NeMo Retriever) 마이크로서비스’를 활용해 GPU에서 데이터 추출 및 검색 속도를 최대 15배 향상시킨다. 이를 통해 텍스트, PDF, 이미지, 비디오 등 다양한 유형의 데이터를 빠르게 처리하고 정확한 응답을 제공할 수 있다.

현재 DDN, 델 테크놀로지스(Dell Technologies), 휴렛팩커드 엔터프라이즈(HPE), 히타치 밴타라(Hitachi Vantara), IBM, 넷앱(NetApp), 뉴타닉스(Nutanix), 퓨어스토리지(Pure Storage), 바스트 데이터(VAST Data), 웨카(WEKA) 등 글로벌 주요 스토리지 기업들이 엔비디아와 협력해 맞춤형 AI 데이터 플랫폼 솔루션을 개발 중이다.

각 기업은 자사 제품군에 엔비디아의 최신 기술을 통합해 고객에게 더욱 효율적이고 강력한 AI 인프라를 제공할 계획이다. 대표적으로 델 테크놀로지스는 ‘파워스케일(PowerScale)’ 제품군과 ‘프로젝트 라이트닝(Project Lightning)’에, HPE는 ‘프라이빗 클라우드 포 AI(Private Cloud for AI)’ 등 다양한 제품에 엔비디아 AI 데이터 플랫폼을 적용할 예정이다.

엔비디아 인증 스토리지 공급업체들은 이번 달부터 본격적으로 엔비디아 AI 데이터 플랫폼 기반 솔루션을 시장에 출시할 계획이다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지