퓨리오사AI, NPU 가속기 ‘RNGD’ MS 애저 마켓플레이스 출시

LLM 및 멀티모달 모델 효율적인 추론 지원

2025-04-17     성원영 기자

[아이티데일리] AI 반도체 기업 퓨리오사AI(대표 백준호)는 자사의 2세대 AI 추론 가속기 ‘레니게이드(RNGD)’를 마이크로소프트(MS)의 ‘애저 마켓플레이스(Azure Marketplace)’에 공식 출시했다고 17일 밝혔다. 이에 따라 애저 유저들은 레니게이드를 사용해 고성능 AI 인프라를 손쉽게 활용할 수 있게 될 전망이다.

한국 마이크로소프트(MS) 조원우 대표(왼쪽)와 퓨리오사AI 백준호 대표가 MOU 체결 기념사진을 촬영하고 있다.

RNGD는 대형언어모델(LLM) 및 멀티모달 모델의 효율적인 추론을 위해 설계된 데이터 센터용 AI 가속기다. 퓨리오사AI는 지난해 8월 ‘핫 칩스(Hot chips) 2024 컨퍼런스’에서 레니게이드를 선보여 글로벌 테크 업계의 관심을 모은 바 있다.

레니게이드의 주요 특징은 데이터 처리 능력과 유연성이다. 레니게이드는 256MB의 온칩 메모리를 탑재했다. 이를 통해 정보가 한 방향으로 흐르는 피드포워드 네트워크에서 발생하는 모든 중간 데이터를 저장하고, 다음 계층의 가중치를 미리 불러올 수 있다. 또한 클라우드 중심, 온프레미스, 하이브리드 등 다양한 환경에 최적화됐으며 △수분 내로 추론용 프로덕션 환경 배포 △수요에 따라 유연하게 추론 인프라 규모 조절 △기존 애저 데이터 및 소프트웨어 스택과 원활한 통합 등의 기능을 제공한다.

효율적인 전력 소비도 레니게이드의 특징 중 하나다. 최근 데이터 처리에 사용되는 GPU의 경우 최대 1,200와트(W)의 전력을 소모하는 반면, 레니게이드는 150W의 열 설계 전력(TDP)으로 작동하도록 설계됐다.

나아가 퓨리오사AI는 ‘라마(Llama)3.1’ 사전 컴파일 모델 기반 API를 제공할 계획이다. 이 API는 레니게이드를 기반으로 라마3.1 모델을 사용해 애플리케이션을 만들 고객들을 대상으로 한 서비스다. 해당 고객들은 레니게이드의 추론 성능을 기존 워크플로우 내에서 즉시 테스트하고 활용할 수 있다. 향후 다양한 모델 아키텍처 지원도 순차적으로 확대될 예정이다.

MS 제이크 즈보로프스키(Jake Zborowski) 애저 플랫폼 총괄은 “애저 마켓플레이스는 전 세계 고객이 신뢰할 수 있는 파트너 솔루션을 쉽게 찾고 배포할 수 있는 공간”이라며 “퓨리오사AI의 레니게이드를 이 생태계에 새롭게 맞이하게 돼 기쁘다”고 말했다.

한편 이번 출시를 계기로 퓨리오사AI는 자사 제품 보급에 박차를 가할 계획이다. 현재 국내외 기업 고객을 대상으로 레니게이드 제품평가를 진행 중이며, TSMC와의 협업을 통해 대규모 양산에 돌입했다.

퓨리오사AI 관계자는 “레니게이드의 애저 통합은 누구나 접근 가능한 효율적인 AI 추론 인프라를 제공한다는 당사의 비전을 실현하는 중요한 이정표”라며 “스타트업부터 대기업까지 복잡한 AI 인프라 없이도 필요한 성능을 쉽고 빠르게 확보할 수 있을 것”이라고 밝혔다.