인텔 ‘가우디3’, IBM 클라우드로 AI 가속기 클라우드 서비스 선봬

AI 특화 하드웨어의 높은 비용 장벽 낮출 것으로 기대

2025-05-08     성원영 기자

[아이티데일리] 인텔은 IBM 클라우드가 클라우드 서비스 제공사로는 처음으로 ‘인텔 가우디3(Intel Gaudi 3) AI 가속기 기반 상용서비스’를 제공한다고 8일 밝혔다. 이로써 클라우드 서비스 고객들이 고성능 인공지능 역량을 보다 쉽게 활용할 수 있도록 지원하고 AI 특화 하드웨어의 높은 비용 장벽을 낮출 수 있을 것이라고 밝혔다. 

인텔은 IBM 클라우드가 클라우드 서비스 제공사로는 처음으로 ‘인텔 가우디3(Intel Gaudi 3) AI 가속기 기반 상용서비스’를 제공한다고 8일 밝혔다.

IBM 클라우드는 다양한 기업 고객, 특히 금융 서비스, 의료 및 생명 과학, 공공 부문 등 규제 산업에 종사하는 고객에게 서비스를 제공한다. 이번 IBM 클라우드 상용화는 가우디3의 첫 대규모 상업 배포로써 인텔에게는 시장에 AI 가속기의 새로운 선택지를 제공하는 의미 있는 이정표다. 양사는 IBM 클라우드에서 인텔 가우디3을 활용해 고객이 합리적인 비용으로 생성형 AI를 테스트·혁신·배포하도록 돕는 것을 목표로 하고 있다. 

많은 기업들이 생성형 AI와 같은 도구가 자동화·워크 플로우 개선·혁신 촉진 등에 분명한 이점이 있다는 것을 알고 있으나, AI 애플리케이션 구축에는 막대한 연산 능력이 필요하고 대개의 경우 고가의 특화된 프로세서를 요구하기 때문에 많은 기업들은 AI 혜택을 누리지 못하고 있는 실정이다. 

회사는 가우디3 AI 가속기가 개방형 개발 프레임워크를 지원하면서 생성형 AI·대규모 모델 추론·파인튜닝 등에 대한 폭발적인 수요를 충족하도록 설계됐고, 멀티모달 LLM(대규모언어모델)과 RAG(검색 증강 생성) 워크로드에 최적화됐다고 설명했다.

현재 가우디 3은 독일 프랑크푸르트, 미국 택사스 댈러스 등의 IBM 클라우드 리전에 적용돼 사용할 수 있다. 

가우디3은 IBM의 광범위한 AI 인프라스트럭처 제품에도 통합되고 있다. 고객들은 현재 IBM VPC(가상 프라이빗 클라우드)의 IBM 클라우드 가상 서버를 통해 가우디 3을 사용할 수 있으며, 2025년 하반기부터 다양한 아키텍처에 배포할 수 있다. ‘레드햇 오픈시프트(Red Hat OpenShift)’와 ‘IBM 왓슨엑스 AI 플랫폼(IBM’s watsonx AI platform)’에 대한 지원은 이번 분기 내 가능해질 예정이다.

또한 가우디3 AI 가속기는 성능과 가격의 균형을 통해 AI 도입에 있어 가장 큰 과제인 비용 문제를 해결할 것으로 기대된다. 조사기관 시그널65(Signal65)가 인텔 의뢰로 실시한 최신 AI 추론 벤치마크 테스트에 따르면, 가우디3은 메타(Meta)의 ‘라마(Llama)-3.1-405B-Instruct-FP8’ 모델(대용량 컨텍스트 크기 기준) 실행 시 경쟁 제품 대비 비용 효율성(성능 대비 가격)이 92% 높은 것으로 파악됐다.

비용 효율성은 동일한 투자로 더 많은 AI 연산을 수행하거나 같은 연산을 더 낮은 비용으로 처리할 수 있도록 하는 핵심지표이다. 회사는 이번 성능 향상을 통해 생성형 AI가 확산하고 있는 흐름 속에서 모델 배포 혹은 미세 조정을 원하는 기업의 비용 장벽을 크게 낮춰 줄 것으로 전망했다.