[분석] AI 경쟁 바꿀 소규모언어모델(SLM)…“용도 특화와 비용 효율성 매력”
AI 에이전트 트렌드에도 SLM 모델이 궁합 더 맞아 금융 물류 등 다양한 산업 분야에서 SLM과 에이전틱 AI 융합 일어날 듯
[아이티데일리] 오픈AI의 챗GPT나 구글 제미나이 등 생성형 AI가 등장한 지 2년 6개월이 지났다. 텍스트나 이미지를 인간처럼 이해하고 답을 생성하도록 훈련된 대규모언어모델(LLM)이 기술 분야를 휩쓸고 있다.
하루가 다르게 바뀌고 진보하는 기술 분야에서, 생성형 AI 만큼 장기간 거의 혁명에 가까운 변화 트렌드를 이끌어온 것도 드문 일이다. 오픈AI 이후 마이크로소프트, 구글, 메타 등 빅테크들이 대거 뛰어들면서, 지금까지의 AI 개발 경쟁은 더 크고 더 많은 데이터와 더 강력한 연산 능력을 바탕으로 한 '규모의 경쟁' 중심으로 전개되어 왔다.
그러던 생성형 AI 시장에 변화가 보이기 시작한다. 최근에는, GPT-4나 제미나이와 같은 LLM과 달리, 보다 작고 슬림하며, 특정 비즈니스 용도에 강점을 가진 소규모언어모델(SLM)에 대한 개발 움직임도 활발해지고 있는 것이다.
전략적 IT 서비스를 제공하는 컨설팅 기업 모빌라이브(MobileLive)의 창립자이자 CEO인 자한 알리는 포브스와의 인터뷰에서 “차세대 AI 트렌드는 특정 목적에 맞게 설계된 SLM 모델이 될 것이다”라며 “SLM은 특정 분야의 전문 지식을 집중 학습시키기 때문에 실제 비즈니스 세계의 요구에 대해 훨씬 잘 대응할 수 있다”고 강조했다.
SLM은 특정 산업, 작업, 업무 워크플로우에 맞게 미세 조정된 AI 모델을 뜻한다. 방대한 범용 지식을 처리하는 LLM과 달리, SLM은 정확성과 효율성을 중시해 설계된다. 그 때문에 적은 연산 자원으로도 운영이 가능하고, 비용을 절감하면서도 비즈니스에 더 많은 인사이트를 제공할 수 있다.
SLM은 단순한 LLM의 축소판이 아니다. 금융, 의료, 소프트웨어 개발 등 특정 분야에서 뛰어난 성과를 내도록 최적화되어 있다. 그래서 조직 고유의 요구에 맞춘 정확하고 신뢰성 높은 결과를 제공할 수 있다.
AI 반도체 전문기업 헤일로(Hailo)의 공동창업자이자 CTO인 아비 바움도 포브스에서 이에 동의한다고 화답했다. 그는 “LLM이 처음 등장했을 때는, 엄청난 규모의 지능에 집중했지만, 지금은 실용성을 중요시하면서 소형화되고 정교한 모델이 부상하고 있다”고 지적했다. 바움은 “이런 SLM은 고효율성과 함께 강력한 추론 능력을 유지하면서, 클라우드에 의존하지 않는 로컬에서의 실행이 가능하다”고 설명했다.
SLM의 수요 증가의 배경에는 LLM에 관련된 프라이버시나 보안 문제가 있다. 많은 기업들이 데이터 유출이나 컴플라이언스 위반 위험 때문에 고민하고 있다. 클라우드 기반 생성형 AI도 완벽하지 않다는 진단이다. 반면 SLM은 노트북, 로봇, 휴대폰 등 엣지 디바이스에서 직접 실행할 수 있다. 따라서 데이터 보안을 유지하기 용이하다.
SLM을 둘러싼 논의는, AI 에이전트(Agentic AI)로도 이어진다. AI 에이전트는 기존 AI와 달리, 입력 데이터를 기반으로 실시간 및 자율적으로 판단하고 행동하는 AI다. AI 에이전트를 구현하려면 가볍고 빠르며 고도로 전문화된 모델이 필요하다. 그야말로 SLM이 최적이라고 할 수 있다.
AI 전문가 스튜어트 로버츠는 영국 버딕트에 기고한 글에서 “SLM은 LLM보다 높은 정확도를 실현할 수 있고, 연산 자원도 적게 들며, 서형이기 때문에 에코시스템 통합이 유리하다. 이 점에서 AI 에이전트와 궁합이 잘 맞는다”고 설명했다.
알리는 SLM이야말로 AI의 차세대 돌파구가 될 것이라고 강조했다. “SLM은 특정 분야의 깊은 지식을 기반으로 훈련되어 있어 AI 에이전트가 자율적으로 판단할 수 있게 한다. 예를 들면, 단순히 시장을 분석하는 것이 아니라, 실시간 데이터를 바탕으로 자동으로 거래를 실행하는 금융 에이전트나, 공급망을 추적하면서 배송 또는 재고 수준을 최적화하는 ‘물류 AI’를 상상하면 된다”고 말했다.
SLM은 엣지 디바이스에서 자율적인 의사결정을 가능하게 하며, 이는 AI 에이전트의 트렌드와 부합한다. 예를 들어 스마트 공장에서는 인간의 개입 없이 AI 에이전트가 SLM을 활용해 장비 고장을 예측하고 설정을 조정하거나 유지보수를 예약할 수 있게 된다.
투자에 소요되는 자금 측면에서 LLM은 이미 ‘돈 먹는 하마’다. 생성형 AI의 포문을 연 오픈AI는 물론 구글, 앤트로픽, 마이크로소프트, 메타 등은 첨단 LLM 훈련에 수십억 달러의 돈을 쏟아붓고 있다. 전 세계를 누비며 AI 데이터센터 건설 부지를 물색하고 있다. AI 데이터 처리에 필요한 엔비디아의 GPU가 동날 정도고, 엔비디아는 일약 세계 최고의 가치 기업으로 우뚝 섰다. 이들 LLM은 소형 모델을 추출하고 정제하는 기반으로는 유용하지만, 투자수익률(ROI) 면에서는 의문이 제기된다.
그래서 AI 개발의 경제성 면에서는 SLM에 유리한 방향으로 흐르고 있다. SLM의 가장 큰 장점은 비용 대비 효과다. SLM은 적은 자원으로도 특정 작업에 대해 높은 정확도를 낼 수 있어 ROI가 매우 높다.
물론 SLM에도 과제는 있다. 특히 모델 훈련을 위해서는 영역 특화 고품질 데이터가 필수다. 긴 문맥이나 복잡한 추론을 요구하는 작업에서는 잘 작동하지 않을 수도 있다. SLM이 제대로 작동하려면 적절한 훈련 데이터의 큐레이션이 중요하다. 목적에 맞게 전문가가 정보와 데이터를 수집하고 정리 및 편집해야 한다. 고품질의 데이터 세트가 없으면 SLM은 신뢰성을 담보할 수 없다. 가장 좋은 방법은 현장 비즈니스 데이터를 활용해 지속적으로 재학습시키는 것이다.
중소규모 기업의 경우 LLM 보다는 SLM이 비즈니스의 중심이 될 가능성이 높아 보인다. 대기업은 LLM과 SLM을 모두 활용하는 하이브리드 방식으로 운영할 것이다. 이제 실질적인 관심은 “어느 AI 모델이 유행하고 있으며, 기능이 좋은 모델은 무엇인가”가 아니라 “LLM이든 SLM이든 어떤 모델이 나의 관심과 비즈니스의 욕구를 해결해줄 수 있을 것인가”가 될 것이라는 지적이다.