IBM, 기업용 멀티모달·추론 AI 모델 ‘그래니트 3.2’ 출시
개발자 친화적 라이선스로 추론·비전·가드레일 기능 지원
[아이티데일리] IBM은 자사 거대언어모델(LLM) 제품군의 차세대 버전인 ‘그래니트(Granite) 3.2’를 출시했다고 27일 밝혔다.
IBM은 작고 효율적이며 실용적인 기업용 인공지능(AI)인 그래니트 3.2를 통해 실질적인 비즈니스 효과 창출을 지원한다는 방침이다.
새로 출시된 그래니트 3.2 모델은 허깅 페이스(Hugging Face)에서 허용되는 아파치 2.0 라이선스에 따라 사용할 수 있다. 일부 모델들은 IBM 왓슨x.ai(IBM watsonx.ai), 올라마(Ollama), 리플리케이트(Replicate), LM 스튜디오 등에서 즉시 사용 가능하다.
곧 레드햇 엔터프라이즈 리눅스(RHEL) AI 1.5에서도 제공돼 기업과 오픈소스 커뮤니티를 통해 새로운 기능이 제공될 예정이다.
그래니트 3.2는 문서 해석 작업을 위한 새로운 비전 언어 모델(VLM)이다. 특히 필수 엔터프라이즈 벤치마크인 DocVQA, ChartQA, AI2D 및 OCRBench 등에서 기존 대형 모델인 라마 3.2 11B 및 픽스트랄 12B와 동등하거나 그 이상의 성능을 입증했다는 게 회사 측 설명이다.
IBM은 풍부한 학습 데이터뿐 아니라 자체 오픈소스 도클링(Docling) 도구를 활용해 8,500만 개의 PDF를 처리하고 2,600만 개의 합성 질문·답변 조합을 생성해 복잡한 문서 중심의 업무를 처리하는 VLM의 능력을 향상시켰다고 강조했다.
아울러 그래니트 3.2 2B 및 8B 모델에서 제공되는 향상된 추론을 위한 ‘연쇄적 사고(Chain of thought)’ 기능을 지원한다. 이를 통해 추론 기능을 활성화하거나 비활성화해 효율성을 최적화할 수 있다.
해당 기능을 토대로 8B 모델은 안전성이나 성능 저하 없이 아레나하드(ArenaHard) 및 알파카이벨(AlpacaEval)과 같은 인스트럭션 추종 벤치마크에서 이전 모델보다 두 자릿수 개선을 달성했다고 IBM은 밝혔다. 또 그래니트 3.2 8B 모델의 경우 새로운 추론 확장(inference scaling) 방법으로 AIME2024 및 MATH500과 같은 수학 추론 벤치마크에서도 클로드 3.5-소넷과 GPT-4o와 같은 대규모 모델의 성능에 필적하도록 보정할 수 있다는 설명이다.
이러한 그래니트 3.2는 기존 그래니트 3.1 가디언 모델의 성능을 유지하면서 크기를 30% 줄인 그래니트 가디언(Granite Guardian) 안전 모델의 소형화 버전이다. 3.2 모델에는 안전 모니터링의 모호성을 인식하고, 보다 정교한 위험 평가를 제공하는 언어화된 신뢰도(verbalized confidence)라는 새로운 기능이 도입됐다.
IBM은 그래니트 3.2 인스트럭트, 비전 및 가드레일 모델과 함께 최대 2년 후의 미래까지 장기 예측할 수 있는 기능을 갖춘 차세대 시계열 모델 ‘타이니타임믹서(TTM, TinyTimeMixers)’ 모델(매개변수 1,000만 개 미만)도 출시한다. 이는 금융 및 경제 동향, 공급망 수요 예측, 유통 업계의 계절별 재고 계획 등 장기적인 트렌드 분석을 위한 솔루션이다.
IBM AI 연구 담당 스리람 라가반(Sriram Raghavan) 부사장은 “다음 AI 시대는 기업이 과도한 컴퓨팅 비용 없이도 강력한 성과를 달성할 수 있는 효율성, 통합 가능성, 실용성이 화두가 될 것”이라며 “개방형 솔루션에 중점을 둔 IBM의 최신 그래니트 모델은 오늘날의 기업들의 AI 접근성, 비용 효율성, AI 자체의 가치를 높이는 데 있어 도움을 줬다고 생각한다”고 말했다.