실시간 레이 트레이싱, AI, 시뮬레이션 및 레스터화 등 하이브리드 렌더링 구현

▲ 엔비디아가 ‘튜링’ 아키텍처를 선보였다.

[아이티데일리] AI 컴퓨팅 기술 기업 엔비디아(CEO 젠슨 황)는 엔비디아 ‘튜링(Turing)’ GPU 아키텍처를 출시했다고 16일 밝혔다.

엔비디아는 2006년 ‘쿠다(CUDA)’ GPU가 탄생한 이래 ‘튜링’이 가장 큰 도약을 이뤘다고 설명했다. ‘튜링’의 주요 특징은 레이 트레이싱(ray-tracing)을 가속화하는 새로운 RT 코어와, 세계 최초로 실시간 레이 트레이싱을 지원하는 AI(인공지능) 추론용 텐서 코어(Tensor Core)를 갖췄다는 점이다.

엔비디아는 이 두 가지 엔진이 시뮬레이션과 향상된 래스터화(rasterization)를 위한 보다 강력한 컴퓨팅을 제공하는 동시에, 2,500억 달러 규모의 시각효과 시장을 겨냥한 차세대 하이브리드 렌더링의 새로운 지평을 열 것으로 기대했다. 하이브리드 렌더링은 매우 복잡한 모델에서 신경망 및 유체 상호작용을 통해 영화와 같은 수준의 인터랙티브 경험과 새로운 효과를 구현해낸다.

엔비디아는 또한 다양한 산업 분야에 종사하는 5천 만여 디자이너 및 아티스트들의 작업을 혁신시키는 자사 최초의 ‘튜링’ 기반 제품인 ▲‘쿼드로(Quadro) RTX 8000’ ▲‘쿼드로 RTX 6000’ ▲‘쿼드로 RTX 5000’ GPU 등도 공개했다. ‘튜링’ 기반 ‘쿼드로’ GPU는 오는 4분기부터 시판될 예정이다.

젠슨 황(Jensen Huang) 엔비디아 CEO는 컴퓨터 그래픽 컨퍼런스인 ‘시그라프 2018(SIGGRAPH 2018)’에서 기조연설을 통해 “튜링은 지난 10여 년간 컴퓨터 그래픽 분야에서 엔비디아가 이룬 가장 중대한 혁신”이라며, “하이브리드 렌더링은 업계를 변화시켜 한층 아름다운 디자인과 풍부한 엔터테인먼트 및 인터랙티브 경험을 통해 우리의 삶을 고양시킬 수 있는 놀라운 가능성을 열어줄 것이다. 실시간 레이 트레이싱의 등장은 업계의 ‘성배’나 다름없다”고 설명했다.

▲ 젠슨 황 엔비디아 CEO

엔비디아의 8세대 GPU 아키텍처인 ‘튜링’은 세계 최초의 레이 트레이싱 기반 GPU로, 1만여 엔지니어들이 수년간 연구한 노력의 결과다. 튜링의 하이브리드 렌더링을 사용하는 애플리케이션은 기존 ‘파스칼(Pascal)’ 세대보다 6배 빠른 속도로 실제 세계를 시뮬레이션할 수 있다.

엔비디아는 개발자들이 ‘튜링’의 이 같은 기능을 최대한 활용할 수 있도록 새로운 AI, 레이 트레이싱 및 시뮬레이션 SDK를 통해 RTX 개발 플랫폼을 개선시켰다. 또한, 수백만 디자이너, 아티스트 및 과학자들을 대상으로 하는 핵심 그래픽 애플리케이션도 RTX 개발 플랫폼을 통해 튜링 기능을 활용할 계획이다.

시장조사기관 JPR의 존 페디(Jon Peddie) CEO는 “엔비디아의 이번 발표는 컴퓨터 그래픽 역사의 중요한 순간”이라며 “엔비디아는 우리 예상보다 5년이나 앞서 실시간 레이 트레이싱을 선보였다”고 말했다.


RT 코어로 가속화된 실시간 레이 트레이싱

‘튜링’ 아키텍처는 ‘RT 코어’라고 불리는 레이 트레이싱 전용 프로세서를 갖추고 있어 초당 최대 10기가레이(GigaRays)에 달하는 3D 환경에서 빛과 소리가 이동하는 방식을 한층 빠르게 계산한다. ‘튜링’은 실시간 레이 트레이싱을 기존 파스칼 세대보다 최대 25배까지 가속화하며, GPU 노드는 CPU 노드의 30배 이상 속도로 영화 효과를 위한 최종 프레임 렌더링에 사용할 수 있다.

미셸 숄레트(Michele Sciolette) 시네사이트(Cinesite) 최고기술책임자(CTO)는 “시네사이트는 오토데스크(Autodesk) 및 엔비디아와 제휴해 아놀드(Arnold)를 GPU에 도입할 수 있게 된 점을 자랑스럽게 생각한다. 그러나 결과가 이렇게나 극적일 것으로 예상하지 못했다”며, “이는 곧 우리가 더 높은 품질 설정으로 더욱 빨리, 더욱 자주 반복할 수 있음을 의미한다. 이는 우리 아티스트들의 작업 방식을 완전히 바꿔 놓을 것”이라고 말했다.


강력한 텐서 코어로 가속화된 AI

‘튜링’ 아키텍처는 텐서 코어, 딥러닝 훈련 및 추론을 가속화하는 프로세서 등도 갖추고 있으며, 초당 최대 500조 회의 텐서 연산을 지원한다.

이러한 수준의 성능은 새롭고 강력한 기능을 갖춘 애플리케이션을 제작하기 위한 AI 기반 기능을 제공한다. 여기에는 고화질 모션 이미지 생성의 핵심 요소인 딥러닝 앤티 앨리어싱(DLAA), 디노이징, 해상도 스케일링 및 비디오 리타이밍 등이 포함된다.

이 같은 기능들은 엔비디아 ‘NGX’ 소프트웨어 개발 키트(SDK)의 일환이다. 이 키트는 개발자들이 가속화되고 향상된 그래픽과 사진 이미징, 비디오 프로세싱을 사전 훈련된 네트워크로 애플리케이션에 쉽게 통합할 수 있도록 지원하는 새로운 딥러닝 기반 기술 스택이다.


새로운 튜링 스트리밍 멀티프로세서로 한층 빠른 시뮬레이션 및 래스터화 지원

‘튜링’ 기반 GPU는 부동 소수점 데이터 경로, 병렬식 정수 실행 장치, 그리고 이전 세대의 두 배에 달하는 대역폭을 가진 새로운 통합 캐시 아키텍처를 갖춘 새로운 스트리밍 멀티 프로세서(SM) 아키텍처를 특징으로 한다.

가변 비율 음영과 같은 새로운 그래픽 기술과 결합된 튜링 SM은 코어 당 전례 없는 수준의 성능을 제공한다. 최대 4,608개의 코어를 지원하는 튜링은 1초에 최대 16조 회의 병렬식 부동 소수점 연산과 정수 연산이 가능하다.

개발자들은 엔비디아 ‘쿠다10(CUDA 10)’, ‘플렉스(FleX)’ 및 ‘피직스(PhysX)’ SDK를 활용해 과학적 시각화, 가상 환경 및 특수 효과를 위한 입자 또는 유체 역학과 같은 복잡한 시뮬레이션을 생성할 수 있다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지