AI 인프라 지원 위한 데이터센터 포트폴리오 업데이트

[아이티데일리] 인텔은 ‘제온 6 P-코어(Intel Xeon 6 with Performance-cores)’와 ‘가우디 3(Gaudi 3)’ 인공지능(AI) 가속기를 출시했다고 26일 밝혔다. 최적의 와트(watt)당 성능과 더 낮은 총소유 비용(TCO)을 제공해 강력한 AI 시스템을 지원하겠다는 방침이다.

인텔의 데이터센터 포트폴리오에 새롭게 업데이트된 인텔 제온 6 P-코어는 컴퓨팅 집약적인 워크로드를 우수한 효율로 처리할 수 있도록 설계됐다. 회사 측에 따르면, 제온 6는 이전 세대 대비 2배 높은 성능을 제공한다. 코어 수 증가, 메모리 대역폭 2배 증가, 모든 코어에 내장 AI 가속 기능을 갖춘 것이 주요 특징이다. 이 프로세서는 엣지에서 데이터센터 및 클라우드 환경에 이르기까지 AI의 성능 요구를 충족하도록 설계됐다는 게 인텔 측 설명이다.

인텔 제온 6
인텔 제온 6

이와 함께 출시된 가우디 3 AI 가속기는 대규모 생성형 AI 최적화를 위해 64개의 텐서 프로세서 코어(TPC)와 8개의 행렬 곱셈 엔진(MME)으로 구성됐다. 이를 통해 심층 신경망 연산을 가속화한다.

구체적으로 가우디 3는 학습 및 추론 작업을 위한 128GB의 HBM2e 메모리와 확장 가능한 네트워킹을 위한 24개의 200Gb 이더넷 포트를 갖추고 있다. 또한 파이토치(PyTorch) 프레임워크와 허깅페이스(Hugging Face)의 고급 트랜스포머 및 디퓨전 모델과의 호환성을 제공한다. 인텔은 최근 IBM과 협력해 IBM 클라우드에서 가우디 3 AI 가속기를 서비스 방식으로 배포한다고 발표한 바 있다. 이를 통해 양사는 AI를 활용하고 확장하는 데 있어 TCO를 줄이고 성능을 향상시킨다는 방침이다.

인텔 가우디 3 AI 가속기
인텔 가우디 3 AI 가속기

인텔은 델 테크놀로지스(Dell Technologies), 슈퍼마이크로(Supermicro) 등 주요 OEM 파트너들과 협력해 고객의 특정 요구에 맞춘 AI 배포 시스템을 공동 설계하고 있다. 델 테크놀로지스는 현재 가우디 3과 제온 6을 활용한 검색 증강 생성(RAG) 기반 솔루션을 설계 중이다.

아울러 인텔은 마이크로서비스를 통합한 확장 가능한 RAG 시스템을 구축하고, 쿠버네티스(Kubernetes), 레드햇 오픈시프트 AI(Red Hat OpenShift AI) 및 레드햇 엔터프라이즈 리눅스 AI(Red Hat Enterprise Linux AI)에서 쉽게 애플리케이션을 통합할 수 있도록 생성형 AI 플랫폼을 구성했다.

인텔 데이터센터 및 AI 사업 총괄 저스틴 호타드(Justin Hotard) 수석부사장은 “AI에 대한 수요가 데이터센터의 대규모 변화를 이끌고 있다. 업계는 하드웨어, 소프트웨어, 개발 도구에서 다양한 선택지를 원하고 있다”며 “제온 6 P-코어 프로세서 및 가우디 3 AI 가속기의 출시와 함께 인텔은 고객들이 더 높은 성능, 효율성, 보안을 갖춘 워크로드를 구현할 수 있도록 개방형 생태계를 지원하고 있다”고 강조했다.

인텔 데이터센터 및 AI 사업부 한국 영업 총괄 나승주 상무는 “지난 6월 E-코어 기반 제온 6를 출시한 데 이어, 이번에 코어당 고성능 제품을 원하는 고객을 공략할 수 있는 P-코어 제품을 출시하며 제온 6 라인업이 좀 더 풍성해졌다”며 “이뿐 아니라 AI 가속기 신제품인 가우디 3 제품을 출시함으로써, 국내 고객들에게 AI 인프라 구축에 폭넓은 선택지를 제공할 수 있게 됐다. 조만간 주요 OEM에서 오늘 출시한 인텔 제품을 탑재한 서버를 국내에 출시할 계획이다. 국내 고객들도 인텔 신제품의 강점을 빠른 시일 안에 경험할 수 있을 것으로 예상한다”고 밝혔다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지