카이스트, LLM 기반 추천시스템 기술 개발
LLM 학습 없이 사용자 상품 소비 이력 및 상품 텍스트 정보 활용
[아이티데일리] 카이스트(총장 이광형)는 산업 및 시스템공학과 박찬영 교수 연구팀이 네이버와 공동연구를 통해 협업 필터링(Collaborative filtering) 기반 추천 모델이 학습한 사용자의 선호에 대한 정보를 추출하고 이를 상품의 텍스트와 함께 대형언어모델(LLM)에 주입해 상품 추천의 높은 정확도를 달성할 수 있는 새로운 대형언어모델 기반 추천시스템 기술을 개발했다고 17일 밝혔다.
이번 연구는 기존 연구에 비해 학습 속도에서 253% 향상, 추론 속도에서 171% 향상, 상품 추천에서 평균 12%의 성능 향상을 이뤄냈다. 특히 사용자의 소비 이력이 제한된 퓨샷(Few-shot) 상품 추천에서 평균 20%의 성능 향상, 다중-도메인(Cross-domain) 상품 추천에서 42%의 성능 향상을 이뤄냈다. 퓨샷 상품은 사용자의 소비 이력이 풍부하지 않은 상품을 의미하며, 다중-도메인 상품 추천은 타 도메인에서 학습된 모델을 활용해 추가 학습 없이 현재 도메인에서 추천을 수행하는 것을 뜻한다.
기존 LLM을 활용한 추천 기술은 사용자가 소비한 상품 이름들을 단순히 텍스트 형태로 나열해 LLM에 주입하는 방식으로 추천을 진행했다. 예를 들어 ‘사용자가 영화 극한직업, 범죄도시1, 범죄도시2를 보았을 때 다음으로 시청할 영화는 무엇인가?’라고 대형언어모델에 질문하는 방식이었다.
이에 반해 연구팀이 착안한 점은 상품 제목 및 설명과 같은 텍스트뿐 아니라 협업 필터링 지식, 즉 사용자와 비슷한 상품을 소비한 다른 사용자들에 대한 정보가 정확한 상품 추천에 중요한 역할을 한다는 점이다. 하지만 이러한 정보를 단순히 텍스트화하기에는 한계가 존재한다. 이에 연구팀은 미리 학습된 협업 필터링 기반 추천 모델로부터 사용자의 선호에 대한 정보를 추출하고 이를 LLM이 이해할 수 있도록 변환하는 경량화된 신경망을 도입했다.
연구팀이 개발한 기술의 특징으로는 LLM의 추가적인 학습이 필요하지 않다. 기존 연구들은 상품 추천을 목적으로 학습되지 않은 LLM이 상품을 추천할 수 있도록 만들어 파인튜닝(Fine-tuning)하는 방법을 사용했다. 하지만 이는 학습과 추론에 드는 시간을 급격히 증가시키므로 실제 서비스에서 LLM을 추천에 활용하는 것에 큰 걸림돌이 된다.
연구팀은 LLM의 직접적인 학습 대신 경량화된 신경망의 학습을 통해 LLM이 사용자의 선호를 이해할 수 있도록 했고, 이에 따라 기존 연구보다 빠른 학습 및 추론 속도를 달성했다.
연구팀을 지도한 박찬영 교수는 “제안한 기술은 대형언어모델을 추천 문제에 해결하려는 기존 연구들이 간과한 사용자-상품 상호작용 정보를 전통적인 협업 필터링 모델에서 추출해 대형언어모델에 전달하는 새로운 방법으로 이는 대화형 추천 시스템이나 개인화 상품 정보 생성 등 다양한 고도화된 추천 서비스를 등장시킬 수 있을 것이며, 추천 도메인에 국한되지 않고 이미지, 텍스트, 사용자-상품 상호작용 정보를 모두 사용하는 진정한 멀티모달 추천 방법론으로 나아갈 수 있을 것”이라고 말했다.
카이스트 산업 및 시스템공학과 김세인 박사과정 학생과 카이스트 전산학부 강홍석 학사과정(졸) 학생이 공동 제1 저자, 네이버 김동현 박사, 양민철 박사가 공동 저자, 카이스트 산업 및 시스템공학과의 박찬영 교수가 교신저자로 참여한 이번 연구는 데이터마이닝 최고권위 국제학술대회인 ‘국제 데이터 마이닝 학회 ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2024)’에서 올 8월 발표할 예정이다.