‘인스팅트 MI300 시리즈’, 노트북용 ‘라이젠 8040’ 프로세서, ROCm 6 등 선봬

[아이티데일리] AMD는 7일 자사의 ‘어드밴싱 AI(Advancing AI)’ 행사에서 마이크로소프트(Microsoft), 메타(Meta), 오라클(Oracle), 델 테크놀로지스(Dell Technologies), HPE, 레노버(Lenovo), 슈퍼마이크로(Supermicro), 아리스타(Arista), 브로드컴(Broadcom), 시스코(Cisco) 등 주요 파트너사와 함께 클라우드, 기업 및 PC 등 다양한 부문에 고급 AI 솔루션을 제공하기 위한 다양한 협업 사례를 발표했다고 밝혔다.

또한 AMD는 △‘AMD 인스팅트 MI300(Instinct MI300)’ 시리즈 데이터센터 AI 가속기 △대규모 최적화 및 대규모 언어 모델(LLM)을 지원하는 새로운 기능을 갖춘 ROCm 6 개방형 소프트웨어 스택 △라이젠 AI(Ryzen AI)가 탑재된 ‘라이젠 8040(Ryzen 8040)’ 시리즈 프로세서 등 다양한 신제품도 출시했다.

AMD CEO인 리사 수 박사(Dr. Lisa Su)는 “AI는 컴퓨팅의 미래다. AMD는 대규모 클라우드부터 엔터프라이즈 클러스터, AI 지원 지능형 임베디드 기기 및 PC에 이르기까지 AI 시대를 정의할 엔드투엔드 인프라를 강화할 수 있는 독보적인 위치에 있다”고 강조하고 “우리는 생성형 AI를 위한 세계 최고 성능의 가속기인 인스팅트 MI300 GPU에 대한 수요가 매우 높다고 보고 있다. 현재 최대 규모의 클라우드 기업, 업계 최고의 서버 제공업체, 가장 혁신적인 AI 스타트업과 함께 데이터센터 AI 솔루션 분야에서 상당한 모멘텀을 구축하고 있으며, 인스팅트 MI300 솔루션을 시장에 빠르게 보급하고자 긴밀히 협력하고 있다. AI 생태계 전반의 혁신 속도가 빨라지고 있다”고 설명했다.

AMD 인스팅트 MI300A
AMD 인스팅트 MI300A

클라우드에서 엔터프라이즈 데이터센터 및 슈퍼컴퓨터로 확장되는 AI 기술

AMD는 이번 행사 기간 동안 여러 파트너와 함께 AMD 인스팅트 데이터센터 AI 가속기 채택 사례를 발표하고 성장 모멘텀에 대해 강조했다.

마이크로소프트는 AI 워크로드에 최적화된 새로운 ‘애저 ND MI300x v5 가상머신(Azure ND MI300x v5 Virtual Machine)’ 시리즈 구동을 위해 AMD 인스팅트 MI300X 가속기를 활용하는 방안에 대해 자세히 설명했다.

AMD 인스팅트 MI300X
AMD 인스팅트 MI300X

메타는 AI 추론 워크로드를 강화하기 위해 ROCm 6과 함께 데이터센터에 AMD 인스팅트 MI300X 가속기를 추가하고 있으며, AMD가 라마 2(Llama 2) 모델 제품군에 대한 ROCm 6 최적화를 수행한 것에 대해서도 인지하고 있다고 밝혔다.

오라클은 AMD 인스팅트 MI300X 가속기를 갖춘 OCI 베어 메탈 컴퓨팅 솔루션 공급 및 향후 자사 생성형 AI 서비스에 대한 AMD 인스팅트 MI300X 가속기 포함 계획을 발표했다.

또한 다수의 대형 데이터센터 인프라 제공업체가 자사 제품 포트폴리오 전반에 걸쳐 AMD 인스팅트 MI300 가속기를 탑재할 계획이라고 발표했다.

델은 AMD 인스팅트 MI300X 가속기와 파워엣지 XE9680(PowerEdge XE9680) 서버 솔루션을 통합해 생성형 AI 워크로드에 대한 획기적인 성능을 제공하는 확장 가능한 모듈식 제품을 공급한다. HPE는 엔터프라이즈 및 HPC 제품에 AMD 인스팅트 MI300 가속기를 도입한다는 계획을 발표했다.

레노버는 AMD 인스팅트 MI300X 가속기를 레노버 씽크시스템(Lenovo ThinkSystem) 플랫폼에 도입하여 소매, 제조, 금융 서비스 및 의료를 포함한 산업 전반에 AI 솔루션을 지원할 계획이다. 슈퍼마이크로는 자사의 AI 솔루션 포트폴리오 전반에 걸쳐 AMD 인스팅트 MI300 GPU를 제공할 예정이다.

이밖에도 에이수스(Asus), 기가바이트(Gigabyte), 인그라시스(Ingrasys), 인벤텍(Inventec), QCT, 위스트론(Wistron), 위윈(Wiwynn) 등도 AMD 인스팅트 MI300 가속기 기반의 솔루션을 공급할 계획이다.

얼라인드(Aligned), 아르콘 에너지(Arkon Energy), 시라스케일(Cirrascale), 크루소(Crusoe), 덴버 데이터웍스(Denvr Dataworks), 텐서웨이브스(Tensorwaves) 등의 전문 AI 클라우드 사업자 또한 개발자 및 AI 스타트업을 위해 AMD 인스팅트 MI300X GPU에 대한 액세스를 확장하는 제품을 제공할 예정이다.

AMD 인스팅트 MI300 시리즈 및 인스팅트 플랫폼 제품 상세
AMD 인스팅트 MI300 시리즈 및 인스팅트 플랫폼 제품 상세

검증된 개방형 AI 소프트웨어 플랫폼 출시

AMD는 자사의 AMD 인스팅트 데이터센터 가속기를 지원하는 소프트웨어 생태계 확장에 대해서도 강조했다.

AMD는 생성형 AI, 특히 대규모 언어 모델에 최적화된 AMD 인스팅트 GPU용 오픈 소스 소프트웨어 스택인 ROCm 6의 최신 버전을 공개했다. ROCm 6는 새로운 데이터 유형, 고급 그래프 및 커널 최적화, 최적화된 라이브러리 및 강력한 어텐션 알고리즘을 지원한다. 라마 2 기준 텍스트 생성 전체 대기 시간을 비교하면, ROCm6를 MI300X에서 구동 시 MI250에서 실행되는 ROCm 5 대비 최대 8배 향상된 성능을 제공한다는 게 회사 측 설명이다.

최신 모델과 AI 솔루션을 개발하는 스타트업인 데이터브릭스(Databricks), 에센셜 AI(Essential AI), 라미니(Lamini)는 AMD 인스팅트 MI300X 가속기와 개방형 ROCm 6 소프트웨어 스택을 활용해 고객에게 차별화된 AI 솔루션을 제공하는 방법에 논의했다.

오픈AI(OpenAI)는 트리톤 3.0(Triton 3.0)에 AMD 인스팅트 가속기에 대한 지원을 추가해 개발자가 AMD 하드웨어에서 더 높은 수준의 추상화 작업을 수행할 수 있도록 지원한다.


AI PC 발전을 선도

AMD는 이번 행사에서 휴대용 PC 시장 선도력 강화를 목표로 x86 중 동급 최강의 성능을 갖춘 최신 ‘AMD 라이젠 8040 시리즈(AMD Ryzen 8040 Series)’ 프로세서도 출시했다.

AMD 라이젠 8040
AMD 라이젠 8040 프로세서

특히 일부 신제품에는 통합 NPU(Neural Processing Unit, 신경망처리장치)인 ‘라이젠 AI(AMD Ryzen AI)’가 한 다이에 탑재돼 이전 모델 대비 최대 1.6배 향상된 AI 프로세싱 성능을 자랑하며, 새로운 프리미엄급 사용 경험 및 AI 지원 능력을 제공한다.

라이젠 AI
라이젠 AI

 

 

또한 AMD는 개발자가 사전 훈련된 모델을 사용해 윈도우 애플리케이션에 손쉽게 AI 기능을 추가하고 배포할 수 있도록 하는 소프트웨어 스택인 ‘라이젠 AI 1.0(Ryzen AI 1.0)’도 출시했다.

AMD 8040 프로세서 라인업
AMD 8040 프로세서 라인업

아울러 AMD는 2024년 출시 예정인 차세대 ‘스트릭스 포인트(Strix Point)’ CPU에 XDNA 2 아키텍처가 탑재돼 이전 세대에 대비 3배 이상 향상된 AI 컴퓨팅 성능을 제공하고 새로운 생성형 AI 경험을 지원할 것이라고 밝혔다. 이밖에 향후 윈도우 PC의 AI 경험과 관련한 마이크로소프트와의 협력에 대해서도 논의했다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지