라마(Llama), 딥시크(DeepSeek) 등 대규모 AI 모델을 실행할 수 있는 ‘AI 중심’ PC 시리즈도 공개
젠슨 황 "추론 사용하는 딥시크 AI는 더 많은 전력을 필요로 하기 때문에 엔비디아에 도움 돼"

젠슨 황 엔비디아 CEO가 연례 GTC 컨퍼런스에서 새로운 AI 칩을 발표하고 있다. 사진=엔비디아
젠슨 황 엔비디아 CEO가 연례 GTC 컨퍼런스에서 새로운 AI 칩을 발표하고 있다. 사진=엔비디아

[아이티데일리] AI 칩 분야 글로벌 선도기업 엔비디아(Nvidia)가 연례 GTC 컨퍼런스에서 인공지능(AI) 모델을 구축하고 배포하기 위한 새로운 칩을 발표했다. 엔비디아는 젠슨 황 CEO의 기조연설을 공식 홈페이지에 올리고, 관련 자료를 전 세계에 공개했다.

젠슨 황은 이 자리에서 오는 하반기에 출시될 칩 제품군인 블랙웰 울트라(Blackwell Ultra) 칩 패밀리와 내년 출시될 예정인 차세대 그래픽 처리 장치(GPU)인 베라 루빈(Vera Rubin)을 공개했다.

지난 2022년 말경 오픈AI의 챗GPT가 출시된 후 엔비디아의 매출은 6배 이상 증가했다. 이는 고성능 GPU가 AI 모델을 훈련하는 데 필수적인 시장을 대부분 장악하고 있기 때문이다. GPU에 관한 한 엔비디아 기술력과 상품 경쟁력을 따를 기업은 전 세계적으로 거의 존재하지 않는다.

소프트웨어 개발자와 투자자들은 엔비디아의 새로운 칩이 추가 기능 향상과 효율성을 제공할지 주목하고 있다. 칩의 성공은 마이크로소프트, 구글, 아마존 등 클라우드 기업들을 포함한 빅테크들이 엔비디아 칩을 기반으로 데이터 센터를 구축하는 데 수십억 달러를 계속 지출할 것인가에 달려 있다.

CNBC는 이와 관련, 엔비디아의 새로운 칩 출시 발표는 또 다른 시험 무대가 될 것이라고 전했다. AI 붐이 일어나기 전 2년마다 새로운 칩을 발표했던 엔비디아는 이제 매년 새로운 칩 제품군을 발표하고 있다.

엔비디아에 따르면 코로나19 대유행 이후 엔비디아가 두 번째 대면 행사로 개최한 이번 컨퍼런스에는 웨이모, 마이크로소프트, 포드, 제너럴 모터스 등 2만5000명의 관계자들이 참여했다. 제너럴 모터스는 차세대 차량에 엔비디아 기술을 접목할 것이라고 발표하기도 했다.

루빈 이후의 칩 아키텍처는 물리학자 리처드 파인만(Richard Feynman)의 이름을 따서 명명될 것이라고 엔비디아는 전했다. 젠슨 황이 보여준 슬라이드를 통해 엔비디아는 파인만 칩을 오는 2028년에 출시할 예정임도 밝혔다.

엔비디아는 이번 행사에서 다양한 제품과 서비스도 선보였다.

먼저 엔비디아는 자사의 AI 칩을 사용한 새로운 노트북과 데스크톱을 발표했다. 발표된 두 모델 DGX스파크와 DGX스테이션은 라마(Llama)나 딥시크(DeepSeek) 등 대규모 AI 모델을 실행할 수 있는 ‘AI 중심’ PC다. 엔비디아는 또 수백 또는 수천 개의 GPU를 하나로 연결하여 하나처럼 작동하도록 하는 새로운 네트워킹 부품, 사용자가 엔비디아 칩을 최대한 활용할 수 있도록 돕는 다이나모(Dynamo) 소프트웨어 패키지도 발표했다.

이번에 발표된 GPU 베라 루빈이 단연 관심을 끌고 있다. 홈페이지에 소개된 글에 따르면 베라는 엔비디아가 설계한 최초의 맞춤형 CPU이며 루빈은 새로운 GPU 디자인이다. 엔비디아는 2026년 하반기에 이 두 가지를 결합한 차세대 컴퓨터 시스템 출하를 시작할 예정이다. 베라 루빈은 천문학자의 이름을 따서 명명됐다. 베라는 엔비디아의 첫 번째 맞춤형 CPU 디자인이며, 올림푸스라는 이름의 코어 아키텍처를 기반을 환다고 회사는 밝혔다. 과거에는 암(ARM) 기술을 사용했었다. 맞춤형 베라 아키텍처는 지난해 그레이스 블랙웰(Grace Blackwell) 칩에 사용된 CPU보다 두 배 더 빠른 성능을 보인다고 한다.

루빈과 베라를 함께 사용하게 되면 추론 성능은 50페타플롭으로 올라가는데, 이는 현재의 블랙웰 칩이 보이는 20페타플롭보다 두 배 이상 향상된 것이다. 루빈은 또한 AI 개발자가 주시하는 최대 288기가바이트의 빠른 메모리를 지원할 수 있다.

한편 엔비디아는 오는 2027년 하반기에 칩에 결합하는 GPU 모듈을 종래 두 개에서 네 개로 늘려 단일 칩으로 만든 ‘루빈 넥스트’도 출시할 예정이다. 이는 루빈의 처리 속도를 두 배로 늘려주게 된다.

젠슨 황은 나아가 차세대 칩 로드맵으로 블랙웰 패밀리의 확장 버전인 블랙웰 울트라 칩 패밀리도 공개했다. 이 칩은 초당 더 많은 토큰을 생성할 수 있으며, 이는 이 칩이 종래의 칩과 비교해 같은 시간 동안 더 많은 콘텐츠를 생성할 수 있음을 의미한다. 엔비디아는 발표 자료에서 이 칩이 클라우드 기업에 높은 수익을 제공해 줄 것으로 전망했다. 2023년에 출시된 호퍼(Hopper) 세대보다 최대 50배의 수익을 낼 수 있다는 것이다.

중국의 딥시크 R1 모델과 관련, 젠슨 황은 많은 AI 전문가들이 엔비디아의 사업을 위협한다고 우려했지만 “딥시크는 사실 엔비디아에 좋은 신호”라고 해석했다. 딥시크가 사용자에게 더 나은 답변을 제공하기 위해, 더 막대한 컴퓨팅 파워가 필요한 ‘추론’을 사용하기 때문이라는 것이다. 젠슨 황은 새로운 블랙웰 울트라 칩이 추론 모델에 적합할 것이라고 자신했다.

젠슨 황은 "AI는 지난 2~3년 사이에 큰 혁신이 일어났고, 근본적인 발전을 이룩했다. 우리는 이를 ‘에이전트 AI’라고 부른다. 앞으로는 AI가 문제에 대답하거나 해결하는 방법을 추론할 수 있을 것"이라고 덧붙였다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지