저가 고성능 딥시크, 반도체 산업에도 충격…AI 칩 스타트업들 ‘환호’
[아이티데일리] 중국 스타트업 딥시크가 엔비디아를 비롯한 미국의 AI 칩 대기업들의 시가총액을 8000억 달러 이상 날려버린 다음 날 차세대 칩 기업 세레브라스(Cerebras)의 앤드루 펠드먼 CEO는 축배를 들었다고 한다.
펠드먼은 포브스지에 "우리는 환희하고 있다. 지금은 좋은 시기다. 전화가 끊이지 않는다"라고 말했다. AI 칩 스타트업으로서는 일견 역설적으로 보인다. 그러나 실리콘밸리에서 상식처럼 받아들여졌던 '칩을 늘리고 예산을 확대하면 그만큼 뛰어난 AI가 생긴다'는 통념을 딥시크가 뒤집으면서 올 하반기 상장이 전망되는 세레브라스가 큰 관심을 끌고 있다고.
딥시크는 미국의 오픈AI가 오픈AI 등 경쟁사 모델과 거의 동등한 성능을 보이면서도 훨씬 저렴하게 훈련하고 운용할 수 있는 오픈소스 AI 모델을 내놓으면서 미국의 AI 패권을 흔들었다. 펠드먼은 이것이 결과적으로 AI 이용을 폭발적으로 늘릴 것으로 판단하고 있다. “컴퓨팅 성능을 높이고 비용을 낮출 때마다 시장은 오히려 확대해 왔다”는 것이다.
펠드먼의 발언은 다분히 회사를 의식한 것으로 보인다. 시가총액 40억 달러로 예상되는 세레브라스는 AI 활용을 효율화하기 위해 특화된 칩을 만들고 있다. ‘추론’이라고 불리는 프로세스다. 이 칩은 모델에게 방대한 데이터를 주어 훈련하는 단계와 달리, 인간과 같이 모델을 ‘생각하도록’ 추론시킨다. 챗GPT에 메일을 쓰게 하거나 코드 문제를 풀게 할 때는 매번 이 추론 처리가 이루어지고 있다.
추론 분야에서는 엔비디아의 지배력이 비교적 약하다. 때문에 다수의 소규모 스타트업들이 딥시크의 등장을 기회로 받아들이고 있는 것이다. 포브스는 세레브라스와 동종의 스타트업 기업들도 딥시크가 일으킨 변화에 기대를 걸고 있다고 전했다.
시가총액 51억 달러인 삼바노바(SambaNova)의 로드리고 리안 CEO는 "딥시크는 오픈소스와 추론에 관한 AI의 상식을 뒤집었다"고 말했다. 또 시가총액 28억 달러인 글록(Groq)의 COO 서니 마드라는 이 회사가 운영하는 그록클라우드(Groq Cloud)에 딥시크의 R1 모델을 추가한 이후 계정 등록이나 칩 이용이 급증하고 있다며 "추론에 주력하고 있는 기업에게는 매우 좋은 흐름"이라고 말했다. 지난해 6월 1억 2000만 달러를 펀딩받은 스타트업 에치드(Etched)의 공동창업자 로버트 왓헨은 “추론이 훈련보다 중요해진다는 오래 기다려온 변화에 대한 응답”이라고 말했다.
딥씨크에 따르면 작년 12월 말에 공개한 파라미터 수 6710억의 언어 모델 V3는 2개월이라는 기간에 불과 558만 달러만으로 훈련되었다고 한다. 이는 오픈AI의 GPT-4에 투자된 1억 달러를 훨씬 밑도는 금액이다.
포브스에 따르면 많은 전문가는 딥시크가 실제로는 발표 이상의 자금과 계산 자원을 사용했다고 추정한다. 스케일(Scale)의 알렉상드르 왕 CEO는 딥시크가 중국에서 금지되고 있는 최신엔비디아 칩 H100을 약 5만 대 보유하고 있었다고 주장한다. 그러나 예상 밖의 저비용이 미국 경쟁자들을 놀라게 한 것은 분명하다.
딥시크는 모델을 저렴하게 훈련할 수 있을 뿐만 아니라 추론에 대한 투자를 늘림으로써 뛰어난 성과를 얻을 수 있음도 보여줬다. 지난주 딥시크는 오픈AI의 o1 모델과 유사한 추론 모델 R1을 오픈소스로 무료 또는 저가 사용료로 공개했다. 오픈AI는 월 200달러를 과금한다.
또한 R1을 시작으로 추론의 계산량은 더욱 커진다. 추론 처리가 늘어나면 그만큼 저렴하게 사용할 수 있는 추론 효율에 특화된 칩 수요도 늘어난다.
그러나 엔비디아는 강적이다. 엔비디아는 지난 몇 달 동안 자사의 추론 능력을 대대적으로 홍보해 왔다. 경쟁 스타트업들도 이번 엔비디아 주가 하락은 과잉 반응이었다는 데 동의했다. 주가 하락 후 엔비디아는 자사의 추론 능력을 강조하는 성명을 발표했다. “추론에는 상당수의 엔비디아 GPU와 고성능 네트워크가 필요하다”고 강조했다.
물론 오픈AI나 앤트로픽, 구글 딥마인드 등 대기업 AI 첨단 연구소가 엔비디아 GPU에 수십억 달러를 투자했지만, 그것이 낭비된 자금은 아니다. 딥시크는 기존 상식을 뛰어넘는 최적화 기법을 제시한 것이며, 결과적으로 더 크고 더 나은 AI를 누구나 누릴 수 있는 길을 열었다.
딥시크의 성공은 엔비디아의 그늘에 가려져 있던 소규모 AI 칩 스타트업들에게 또 다른 의미로도 상징적이었다.