GPU 관리 기능 대폭 추가…엔비디아 GPU 자원 분할사용 및 모니터링 지원

[아이티데일리] 나무기술(대표 정철)은 GPU 기능을 강화한 ‘칵테일 클라우드’의 4.8버전을 출시했다고 18일 밝혔다.

칵테일 클라우드는 기업의 비즈니스 환경에 따라 맞춤화된 클라우드 구축환경을 지원한다. 멀티 클러스터와 하이브리드 클라우드 환경을 제공하며, 단일한 제어 포인트 화면에서 모든 애플리케이션과 물리서버 및 클라우드 인프라를 통합 관리할 수 있는 것이 특징이다.

나무기술이 이번에 공개한 칵테일 클라우드 4.8 버전은 GPU 관리 기능과 백업과 복원 기능(Backup & Restore)이 강화됐다.

최근 인공지능(AI) 도입 증가로 GPU 사용량이 늘어나면서, 고성능 GPU와 최적화된 클라우드 인프라를 활용한 클라우드 컴퓨팅 환경이 대세가 되고 있다. 이에 맞춰 나무기술은 칵테일 클라우드를 통해 GPU 리소스 공유 및 분할 사용과 모니터링, 클러스터의 데이터 백업과 복원, 프로비저닝 템플릿을 통한 빠르고 쉬운 클러스터 프로비저닝 기능을 제공한다.

칵테일 클라우드 GPU 대시보드
칵테일 클라우드 GPU 대시보드

칵테일 클라우드 GPU 대시보드를 통해 관리자는 세부적인 GPU 클러스터 사용 현황과 GPU 사용률과 GPU 메모리, 온도, 전력 등을 모니터링하고, 노드별 상세 GPU 리소스 사용 현황과 GPU 리소스를 사용하는 포드(Pod) 목록을 조회할 수 있다.

GPU 공유는 타임 슬라이싱(Time Slicing)과 멀티 인스턴스 GPU(Multi Instance GPU, MIG) 등 2가지 방법을 지원한다. 타임 슬라이싱을 이용하면 물리적 GPU를 라운드 로빈(Round Robin) 스케줄러 방식으로 공유해 필요한 워크로드를 최대한 GPU 리소스의 낭비 없이 활용 가능하다.

멀티 인스턴스 GPU를 사용하면, 1개의 물리적 GPU를 최대 7개의 인스턴스로 분할해 GPU 자원의 효율성을 높일 수 있다.

또한 백업과 복원 기능 통해 칵테일 클라우드의 모든 리소스를 저장하고, 스케줄을 통한 백업 자동화 기능으로 안전한 백업 및 빠른 복구 환경을 구현할 수 있다. 관리자는 아마존웹서비스(AWS), 마이크로소프트 애저(MS Azure), 구글 클라우드 플랫폼(GCP) 및 오픈소스 분산 스토리지인 MinIO 등의 다양한 멀티 클라우드 환경을 지원해 벤더 종속성을 탈피할 수 있다.

나무기술 관계자는 “칵테일 클라우드 새 버전은 클라우드 플랫폼을 통해 GPU 활용을 최적화하는 데 개발 중점을 뒀다”며 “향후에도 한층 더 강화된 인공지능과 머신러닝운영(MLOps) 기술을 융합하는 클라우드 플랫폼 서비스를 제공하는 데 최선을 다하겠다”고 밝혔다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지