레이트레이싱 작업을 수행하는 RT 코어 제공… 작업비용 절감 가능

▲ 엔비디아의 ‘T4 텐서 코어(Tensor Core)’ GPU

[아이티데일리] 엔비디아(CEO 젠슨 황)는 아마존웹서비스(AWS)의 ‘아마존 EC2 G4 인스턴스’가 ‘엔비디아 T4 텐서 코어(Tensor Core)’ GPU를 탑재, AI 및 클라우드 게이밍 등의 부문을 강화한다고 23일 밝혔다.

‘엔비디아 T4 GPU’는 ‘아마존 EC2 G4 인스턴스’ 사용자에 고성능, 고효율성 그리고 다양한 기능을 제공해주며, 하이퍼스케일 AI 인퍼런스(inference), 클라우드 게이밍, 최신 RTX 그래픽을 가속화한다.

해당 SW 플랫폼은 ▲딥 러닝을 위한 ‘엔비디아 cuDNN’ ▲데이터 분석 및 머신 러닝을 위한 ‘엔비디아 래피즈(RAPIDS)’, ▲클라우드 워크스테이션 그래픽을 위한 ‘엔비디아 쿼드로 가상 워크스테이션(Quadro Virtual Workstation)’, ▲클라우드 게이밍을 위한 ‘엔비디아 지포스(GeForce)’ 등 다양한 애플리케이션에 최적화됐다.

또한 SW 스택에는 다양한 API, 쿠다(CUDA), 텐서RT(TensorRT), NCCL, 옵틱스(OptiX), 비디오 코덱 SDK와 같은 도메인별로 특화된 쿠다-X 라이브러리가 포함된다. 이로써 사용자는 단일 인스턴스를 활용해 여러 유형의 워크로드를 원활하고 비용 효율적으로 가속화할 수 있다.

‘엔비디아 T4 GPU’는 2세대 텐서 코어 GPU로 쿠다의 프로그래밍 성능을 유지하면서 AI 애플리케이션을 위한 성능을 지원하는 GPU다. ‘엔비디아 T4’는 INT8에서 최대 130 TOPS(초당 테라 연산)의 성능을 구현해 이미지 분류, 객체 감지, 자연어 이해, 자동 음성 인식 및 추천 시스템과 같은 AI 기반 애플리케이션의 혁신, 다양성 및 복잡성을 가속화하는데 필요한 혼합 정밀 텐서 프로세싱 기능을 갖췄다.

이로써, AWS의 EC2 G4의 고객들은 AI 서비스를 대규모로 구축하면서 운영비용은 크게 절감할 수 있다.

또한, 최근 발표된 VM웨어와의 파트너십을 통해, ‘VM웨어 클라우드 온 AWS(VMware Cloud on AWS)’의 사용자들은 ‘엔비디아 T4 GPU’와 ‘v컴퓨트서버’ SW로 가속화될 아마존 EC2 베어 메탈(bare metal) 인스턴스로 효율적이고 안전한 클라우드 서비스를 이용할 수 있게 됐다.

‘엔비디아 T4’는 실시간 레이 트레이싱(Ray Tracing) 및 AI가 강화된 그래픽을 가능하게 한다. 특히, 디자이너와 아티스트들은 실시간 렌더링(rendering), AI가 강화된 그래픽, 영상 및 이미지 프로세싱을 통해 새로운 방식으로 콘텐츠 제작이 가능해졌다. 또한, 클라우드에서 구동되는 엔비디아 RTX 레이 트레이싱 GPU다. 탁월한 효율성으로 레이 트레이싱 작업을 수행하는 전용 컴퓨트 리소스인 RT 코어를 제공해 과거에는 많은 비용이 들었던 레이 트레이싱 작업비용을 줄여준다.

특히, ‘엔비디아 T4’를 탑재한 AWS의 EC2 G4의 인스턴스는 마이크로소프트(Microsoft) DXR, 엔비디아 옵틱스, 벌칸(Vulkan)을 포함한 최신 레이 트레이싱 API를 지원한다. 다양한 산업 분야의 기술 및 크리에이티브 전문가는 AWS 클라우드에서 최신 그래픽 SW 애플리케이션을 실행할 수 있다.

매트 가먼(Matt Garman) AWS 컴퓨트 서비스 담당 부사장은 “우리는 고객들이 컴퓨트 집약적인 애플리케이션의 이점을 누릴 수 있도록 하는데 집중하고 있다. AWS는 다양한 머신 러닝 사용 사례에 최적화된 아마존 EC2의 다양한 인스턴스 유형을 기반으로 머신 러닝 모델을 개발, 훈련, 구축할 수 있는 가장 포괄적인 포트폴리오를 제공한다”며 “‘T4 GPU’로 구동되는 새로운 G4 인스턴스를 통해 모든 개발자들이 머신 러닝을 보다 합리적인 비용으로 활용할 수 있게 됐다”고 말했다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지