미 스타트업 세레브라스 개발 AI 칩, 엔비디아 ‘추론’ 처리 속도 능가
메타 라마4 매버릭에서 사용자당 초당 2500 토큰 처리, 엔비디아보다 2.5배 빨라 무려 4억 개의 트랜지스터 집약…44GB 메모리까지 칩 내부에 통합
[아이티데일리] 미국 인공지능(AI) 칩 스타트업 세레브라스(Cerebras)가 개발한 '웨이퍼 스케일 엔진(WSE)'이 세계 최강 AI 칩 메이커 엔비디아(NVIDIA)의 성능을 앞서는 것으로 나타났다고 발표했다. 세레브라스는 홈페이지를 통해 자사의 칩이 ‘라마4 매버릭’ 추론에서 엔비디아의 블랙웰을 제쳤다‘며 관련 자료를 공개했다.
세레브라스에 따르면 대부분의 컴퓨터 칩은 손톱에서 우표 크기 정도로 작지만, 자사의 AI 칩은 한 변의 길이가 약 22cm에 달하는 거대한 정사각형 형태다. 가장 최근에 개발된 칩에는 무려 4조 개의 트랜지스터가 집적돼 있다.
게시된 자료에서 세레브라스는 “엔비디아는 DGX B200에 탑재된 블랙웰 GPU 8개가 메타의 라마4 매버릭에서 사용자당 초당 1000개의 토큰(TPS)을 처리할 수 있다고 발표했다. 똑같은 조건에서 세레브라스는 TPS가 2500 이상으로 측정돼 엔비디아의 주력 솔루션보다 2.5배나 빠른 처리 속도를 실현했다”고 공식 발표했다. 막대한 수의 트랜지스터 덕분에 WSE가 AI의 추론 처리에서 세계 기록을 세웠다는 것.
◆ ’AI 에이전트 시대‘를 지탱할 속도의 중요성
’추론‘은 인간의 사고나 행동과 유사한 방식으로 작동하는 AI로, 입력이나 프롬프트에 따라 문장이나 이미지, 영상을 생성하는 과정을 뜻한다. 또 토큰(token)은 단어, 문자, 기호 등의 사고의 기본 단위를 말한다.
AI 엔진이 1초에 처리할 수 있는 토큰 수가 많을수록 더 빠른 결과를 얻을 수 있다. 따라서 토큰 처리 속도는 AI 성능을 좌지하는 중요한 요소다. 기업이 수많은 고객의 다양한 요구를 즉시 파악하고 최적의 조건을 제안하려면 빠른 속도가 필수 요소가 된다.
AI 영역에서 속도의 중요성은 날로 커지고 있다. 이제 ’AI 에이전트 시대‘가 열리고 있기 때문이다. 예를 들어 F1 경기 관람을 위한 여행 계획 수립이나 호텔 예약 대행 등 복잡한 과업을 대신 수행하는 AI 에이전트가 보급되기 시작했다.
AI 에이전트는 대량의 데이터 처리를 요구할 뿐만 아니라 상호 간의 통신도 필요하다. 따라서 추론이 느리면 제대로 작동하지 않는다.
세레브라스에 따르면 WSE의 4조 개 트랜지스터는 이러한 고속 처리를 가능케 하는 핵심 요소 중 하나다. 참고로 인텔 코어 i9은 트랜지스터가 335억 개, 애플 M3 울트라는 1840억 개, 엔비디아 블랙웰 B200은 2080억 개 정도다. 세레브라스 칩이 월등하다.
물론 단순히 트랜지스터 수가 많다고 속도가 비례해 빨라지는 것은 아니다. 핵심은 연산 장치나 메모리 등의 모든 요소를 한 장의 칩 위에 집약하는 ’코로케이션(co-location)‘ 설계 기술에 있다. 모든 요소가 조화롭게 최적의 상태로 집적되어야 최상의 성능을 발휘한다. 세레브라스의 핵심 기술이 이것이다.
WSE는 이 설계를 통해 44GB의 초고속 메모리(RAM)를 칩 내부에 탑재, 고속 처리를 실현했다. 회사의 앤드류 펠드먼 CEO는 “AI의 연산 처리는 대량의 메모리를 필요로 한다. 엔비디아는 칩 외부에 탑재된 메모리에 접근해야 하지만, 우리 제품은 AI 칩 내부에 들어가 있어 그만큼 속도도 빠르다”고 강조했다.
◆ 칩 기술에서의 새로운 도약
독립 리서치 업체인 아티피셜 어낼리시스(Artificial Analysis)가 세레브라스 칩 성능을 교차 테스트했다. 라마4 상에서 세레브라스 칩을 테스트한 결과, 초당 2522 토큰의 처리 속도를 확인했다. 같은 시험에서 엔비디아의 블랙웰은 초당 1038 토큰이 나왔다.
세레브라스의 WSE 칩은 컴퓨터 칩 설계의 의미 있는 진전을 보여준다. 최근 수십년 동안 컴퓨팅의 주역은 CPU였다. 최근 들어 GPU가 게임이나 영상처리를 담당하는 CPU의 보조 역할을 넘어서서 AI 개발의 중심에 섰다.
세레브라스는 “우리의 WSE는 x86이나 ARM과는 전혀 다른 새로운 아키텍처로, GPU를 가속하기 위한 설계”라고 설명하고 “이는 기존 기술의 연장이 아니라, 칩 기술에서의 새로운 도약”이라고 강조했다.