GPU 오퍼레이터로 워크플로우를 코드화…쿠버네티스 클러스터 설정 자동화 가능

▲ 엔비디아가 AI 배포를 간소화할 수 있는 ‘NGC-레디 포 에지’를 공개했다.

[아이티데일리] 엔비디아(CEO 젠슨 황)는 ‘MWC 2019 로스앤젤레스’에서 ‘엔비디아 EGX 엣지(NVIDIA EGX Edge) 슈퍼컴퓨팅 플랫폼’과 ‘NGC-레디 포 에지(NGC-Ready for Edge)’ 시스템을 공개했다고 23일 밝혔다.

현재 AI 워크로드를 대규모로 구현하는 기업은 온프레미스 데이터센터와 클라우드를 결합해 AI 모델을 데이터가 수집되는 위치로 불러오고 있다. 하지만 데이터센터에 대한 IT 전문 지식이 없는 경우, 소매점이나 주차장과 같은 에지에 위치한 워크로드를 배치하는 일은 어려울 수 있다.

쿠버네티스(Kubernetes)는 애플리케이션 배포, 관리, 확장에 관련된 많은 수동 프로세스를 제거해주는 관리 기술로 온프레미스, 에지 및 클라우드 환경 전반에 걸쳐 일관된 클라우드 네이티브 구축 접근 방식을 제공한다.

그러나, 원격으로 수백 또는 수천 개의 애플리케이션을 관리하도록 쿠버네티스 클러스터를 설정하는 일은 매우 번거로울 수 있다. 이에 ‘엔비디아 EGX 엣지(NVIDIA EGX) 슈퍼컴퓨팅 플랫폼’을 통해 이러한 과제를 해결할 수 있다.


AI 배포 간소화 부문

‘엔비디아 EGX’는 대규모 하이브리드 클라우드 및 에지 운영을 가능하게 하고 이를 효율적으로 수행할 수 있게 해주며, 이를 위해 설계된 클라우드 네이티브 소프트웨어 정의 플랫폼이다. 플랫폼 내에는 ‘엔비디아 드라이버’, ‘쿠버네티스 플러그인’, ‘엔비디아 컨테이너 런타임’ 및 GPU 모니터링 도구가 포함된 ‘EGX 스택’이 있으며, 엔비디아 ‘GPU 오퍼레이터(Operator)’를 통해 제공된다. 운영자는 운영 지식과 워크플로우를 코드화해 쿠버네티스를 통해 컨테이너형 애플리케이션의 라이프사이클 관리를 자동화한다.

‘GPU 오퍼레이터’는 GPU 지원 쿠버네티스 시스템 프로비저닝에 필요한 모든 구성 요소의 배포를 표준화하고 자동화하기 위한 헬름 차트(Helm Chart)가 구축된 클라우드 네이티브 방식이다. 이를 위해 엔비디아는 클라우드 네이티브 커뮤니티에 속한 레드햇을 비롯한 다른 업체는 GPU 오퍼레이터를 만들기 위해 협력했다.

GPU 오퍼레이터는 또한 IT 팀이 CPU 기반 시스템을 관리하는 것과 동일한 방식으로 원격 GPU 파워 서비스를 관리할 수 있도록 해준다. 따라서 단일 이미지로 구성된 원격 시스템을 쉽게 도입할 수 있으며, 추가적인 전문 지식 없이도 에지 AI 애플리케이션을 실행할 수 있다.


NGC-레디 포 엣지

‘NGC-레디 시스템’은 엔비디아의 GPU 최적화된 컨테이너용 소프트웨어 허브인 NGC에서 AI 소프트웨어의 기능과 성능을 검증한다. 이는 에지 구현을 위한 기본적인 요건이며, 검증된 시스템은 ‘EGX 스택’ 실행에 이상적이고 하이브리드 구축을 용이하게 한다.

검증된 NGC-레디 포 엣지 시스템은 ‘어드밴텍’, ‘알토스 컴퓨팅’, ‘애즈락 랙’, ‘아토스’, ‘델 테크놀로지스’, ‘기가바이트’, ‘휴렛팩커드 엔터프라이즈’, ‘레노버’, ‘미텍’, 등 세계 주요 제조업체에서 제공된다.


NGC 레지스트리 확대

NGC는 현재 AI 소프트웨어 배포와 관리를 위한 헬름 차트 레지스트리를 제공한다. 헬름 차트는 강력한 클라우드 네이티브 툴로, 애플케이션 구축 방법과 위치를 커스터마이징하고 자동화한다.

‘NGC-레디 서포트’ 서비스를 통해 개발자와 운영팀은 자체 ‘NGC-레디 포 에지’ 시스템이 헬름 차트를 푸시하고 공유할 수 있도록 프라이빗 헬름 레지스트리에 액세스할 수 있다. 이를 통해 운영팀은 일관되고 안전하며 신뢰할 수 있는 환경을 활용해 지속적인 통합과 구축 주기를 단축할 수 있다.


NGC를 통한 AI 소프트웨어 배포

GPU 기반 쿠버네티스 클러스터를 여러 플랫폼에 걸쳐 쉽게 프로비저닝하고 헬름 차트와 컨테이너를 사용해 AI 애플리케이션을 신속하게 배포할 수 있다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지