[아이티데일리] 미국 정부가 엔비디아의 최첨단 인공지능(AI) 칩에 대한 중국 기업의 접근을 제한한 것이 의도치 않은 결과를 가져왔다. 중국의 AI 개발자들이 미국의 경쟁자들을 앞지르는 뜻밖의 결과를 가져온 것.
그 주인공은 중국 스타트업 딥시크(DeeSeek)다. 딥시크가 개발한 생성형 AI 모델 R1이 오픈AI의 최고 경쟁자로 부상했다. 월스트리트저널(WSJ)에 따르면 딥씨크는 경쟁사보다 엄청나게 적은 수의 성능이 떨어지는 AI 칩을 사용, 훨씬 낮은 비용으로 짧은 시간에 R1을 개발했다.
효과적인 생성형 AI 모델을 저렴한 비용으로 구현한 R1의 성공은 생성형 AI 시장을 선도하던 미국에 큰 경종을 울렸다. 저렴한 모델일수록 성능 개량 속도가 빠를 가능성 또한 높다.
실리콘밸리에서 생성형 AI를 사용해 재무 수익을 예측하는 스타트업을 공동 창업한 앤서니 푸는 WSJ와의 인터뷰에서 "오픈AI 모델은 성능이 최고지만 기능도 다양하다. 내게 필요 없는 기능에 돈을 추가로 지불하고 싶지 않다"면서 지난해 9월 회사에서 사용하는 모델을 앤트로픽의 클로드(Claude)에서 딥시크로 바꿨다고 말했다. 그런데 그 결과가 놀랍다. 푸는 딥시크의 생성형 AI 도구가 클로드와 ‘거의 같은 성능’을, 약 25%의 비용으로 제공했다고 밝혔다.
딥씨크의 성공은 미국 대규모언어모델(LLM) 개발자들을 자극해 새로운 경쟁자를 낳을 가능성이 높다. 더 적은 AI 칩으로 강력한 AI 모델을 구축하게 되면 기존의 생성형 AI 시장 판을 흔들 수 있다. 엔비디아의 성장에도 적신호가 켜진다. 개발자들이 딥시크의 전략을 구사해 더 적은 수의 성능이 떨어지는 AI 칩을 이용할 수 있다. 이 때문에 엔비디아 주가는 27일 하루 동안 17%나 폭락했다.
딥시크는 실리콘밸리의 유력 투자자들을 경탄케 하고 있다. 포브스에 따르면 유명 투자자 마크 안드리센은 X에 “딥시크의 R1은 지금까지 본 것 중에서 가장 경이적이고 인상적인 혁신의 하나”라고 썼다.
사실 딥시크의 기술은 오픈AI나 구글 등 미국의 경쟁사에는 떨어지는 것으로 알려졌다. 그러나 최근 발표된 이 회사의 R1 모델은 미국 개발자들이 필수적이라고 생각한 프로세스를 일부 생략하면서 칩 수를 줄이고 성능이 떨어지는 칩을 사용해 충분한 경쟁력을 확보했다고 WSJ는 지적했다.
게다가 R1은 오픈소스로 제공되기 때문에 기업은 오픈AI나 구글 모델보다 크게 낮은 비용으로 이를 이용할 수 있다. 투자 관련 매체 벤처베스트에 따르면 R1은 허깅페이스(Hugging Face)에서 약 10만 9000회 다운로드돼 트렌드 1위로 부상했으며, 오픈AI의 o1에 필적하는 성능을 5% 이하의 비용으로 제공하고 있다고 한다.
또, R1의 검색 기능은 오픈AII나 퍼플렉서티(Perplexity)보다 뛰어나다는 사용자의 평가이며, R1의 경쟁 상대는 구글의 제미나이 딥서치 뿐이라고 전한다.
딥시크는 최신 모델의 훈련 비용이 560만 달러였다고 밝혔다. 이는 앤트로픽이 2024년 밝힌 훈련 비용 1억 달러에서 최대 10억 달러에 달한다는 모델의 훈련 비용을 크게 밑돈다. 포브스는 일부 전문가들은 딥시크가 밝힌 560만 달러는 상당히 과소평가된 것이라고 지적했지만, 그럼에도 불구하고 엄청나게 저렴한 비용으로 우수한 생성형 AI 모델을 제공할 수 있는 딥시크의 능력은 엔비디아의 미래에 의문을 제기할 수 있다고 전했다.
딥시크가 지난해 말 발표한 V3 모델 개발에는 약 2000대의 엔비디아 칩이 사용된 것으로 알려졌다. 이는 미국 기업들이 같은 크기의 모델을 훈련하기 위해 필요로 하는 수만 대의 칩에 비해 훨씬 적다는 지적이다. 또 UC버클리 연구자들이 주최하는 플랫폼인 챗봇 아레나의 분석에 따르면 V3와 R1 모델은 1월 25일 기준 챗봇 성능 면에서 톱10에 올라 있다고 WSJ는 보도했다.
파이낸셜타임스(FT)에 따르면 딥시크의 CEO인 량원펑(Liang Wenfeng)은 80억 달러를 운용하는 헤지펀드 하이플라이어의 창업자로 AI 칩을 이용해 주가를 예측해 투자한 것으로 알려졌다. 그는 2023년 딥시크를 설립하고 칩 동작을 깊이 이해하는 인프라팀을 구축했다고 FT는 전했다.
딥시크의 성능에 대해서는 마이크로소프트도 호평하고 있다. 마이크로소프트 사티야 나델라 CEO는 세계경제포럼에서 "딥시크의 신모델을 보면 추론 시 계산 효율이 매우 높아 오픈소스 모델로서 매우 효과적"이라고 말했다. 그는 또 "중국의 생성형 AI 개발 진전을 진지하게 받아들여야 한다"고도 했다.


