[시장동향③] AI 가속기 시장, 숨겨진 격전지는 ‘소프트웨어’

경쟁사들, 엔비디아 쿠다(CUDA)에 개방형 생태계로 대응

2025-08-29     성원영 기자

[아이티데일리] 인공지능(AI) 산업이 고도화되면서 방대한 연산을 뒷받침하는 ‘AI 가속기’의 중요성이 커지고 있다. 이 시장에서 엔비디아(NVIDIA) 그래픽처리장치(GPU)는 전 세계 데이터센터 시장의 90% 이상을 차지할 정도로 압도적인 위치를 점하고 있다. 이에 맞서 AMD, 인텔(Intel) 등 글로벌 기업들이 AI 가속기를 내놓으며 경쟁 대열에 합류하고 있는 가운데, 국내에서도 팹리스 스타트업을 중심으로 NPU 시장이 형성되기 시작했다. 국내외 AI 가속기 시장 동향과 국산 NPU 산업의 성장 전략에 대해 짚어본다. 

글로벌 기업들이 AI 가속기를 내놓으며 엔비디아와의 경쟁 대열에 합류하는 가운데, 국내에서도 팹리스 스타트업을 중심으로 NPU 시장이 형성되는 추세다. (사진=픽사베이)

AI 가속기 시장에서 하드웨어만큼이나 중요한 것이 소프트웨어다. 리벨리온 관계자는 “실제로 AI 가속기 기업들의 내부 구성을 살펴보면 소프트웨어 팀의 규모가 큰 것을 알 수 있다”며 “리벨리온도 내부에 소프트웨어 관련 팀이 3개나 된다”고 말했다. 특히 학습 시장이 쿠다 생태계에 종속돼 있는 반면 추론 시장의 경우 파이토치(Pytorch), 허깅페이스(Hugging Face) 등과 같은 오픈소스 프레임워크가 보편화돼 GPU 전용 생태계에 대한 의존도가 낮아 경쟁사들은 호환성을 중심으로 소프트웨어 전략을 구축하고 있다.
 

AMD “개방형 소프트웨어 생태계 ‘ROCm’으로 주도”

AMD의 ROCm 소프트웨어는 GPU의 병렬 컴퓨팅 성능 활용을 위해 드라이버, 개발 도구, API를 포함한 오픈 스택이다. 데스크톱부터 데이터센터까지 다양한 하드웨어 환경에 맞춰 최적화할 수 있다.

엔비디아 쿠다가 독점 CUDA API를 사용하는 것과 달리 AMD ROCm은 오픈소스 HIP(Heterogeneous-compute Interface for Portability) API를 지원한다. HIP는 C++ 기반 런타임 API이자 커널 언어로, 개발자가 애플리케이션을 AMD GPU로 손쉽게 이식할 수 있다는 게 회사의 설명이다. 최소한의 코드 변경만으로 기존 프레임워크 수준의 코드베이스를 마이그레이션이 가능한 점도 특징이다.

지난 6월, ‘AMD 개발자 클라우드(AMD Developer Cloud)’가 공개됐다. 이를 통해 개발자들은 ‘AMD 인스팅트 MI300 GPU’에 하드웨어 제약 없이 즉시 접근 가능해졌으며, 무료 크레딧 등을 활용해 원활한 AI 개발과 배포를 지원받을 수 있다.
 

인텔 “엔드투엔드 소프트웨어 패키지 ‘시냅스AI’ 제공”

인텔은 AI 시대 경쟁력 확보를 위해 개방성, 혁신, 효율성, 보안이라는 네 가지 원칙을 중심으로 제품 포트폴리오를 구축하고 있다. 데이터센터 시장을 위해서는 CPU, AI 가속기(가우디) 등 솔루션을 제공하며, 하드웨어와 소프트웨어(OneAPI, OpenVino)를 결합한 개방형 생태계를 구축하고 있다.

인텔 가우디는 ‘시냅스AI(SynapseAI)’라는 엔드투엔드 소프트웨어 패키지를 서비스한다. 가우디 구동에 필요한 드라이버, 런타임, 운영 툴을 비롯해 최적화된 그래프 컴파일러와 가우디 카드(HPU) 간 통신을 위한 콜랙티브 커뮤니케이션 라이브러리(Collective Communication Library) 등을 제공한다. 또한 파이토치, 허깅페이스 등 주요 개방형 표준 프레임워크와도 통합돼 있다.

운영 측면에서는 쿠버네티스(Kubernetes), 도커(Docker), 슬럼(Slurm) 기반 통합을 지원해, 클라우드와 온프레미스 환경 어디서나 손쉽게 배포·관리할 수 있다.
 

리벨리온 “‘리벨리온 SDK’로 개발자에게 익숙한 환경 구현”

국내 사례로는 리벨리온 SDK를 눈여겨볼 필요가 있다. 리벨리온 관계자는 ”리벨리온 SDK는 복잡한 설정을 거치지 않아도 개발자가 AI 모델을 손쉽게 개발할 수 있도록 이를 실제 서비스에 빠르게 적용 가능한 방향으로 개발했다“고 설명했다. 예를 들어 쿠버네티스 기반 자동화 도구인 ‘RBLN NPU 오퍼레이터(Operator)’를 통해 복잡한 설정 없이도 원클릭으로 설치가 가능하다.

리벨리온은 특히 200개 이상의 모델을 실행할 수 있는 모델 주(Model Zoo)를 제공 중이다. 이를 통해 메타의 ‘라마(LLaMa)’, 알리바바의 ‘큐원(Qwen)’등과 SKT의 ‘에이닷’, KT의 ‘믿음’ 등 국내 모델까지 빠르게 적용할 수 있다.