독일 홀름헬츠 연구진, 인간 행동 예측 AI 모델 ‘센타우르’ 개발
[아이티데일리] 혁신적인 AI 시스템은 다양한 상황에서 사람들이 내리는 결정을 예측하는 수준까지 발전할 수 있을 것으로 기대된다. 사람처럼 생각하는 AI가 실용화된다는 얘기다. 그것도 예측 정확도가 매우 높은 확률로. 이런 AI 모델은 심리학에서 인간의 선택을 설명하는데 사용되는 고전 이론을 능가할 수도 있다.
실제로 이 수준에 접근하는 AI 모델이 만들어져 주목된다. 이 소식은 네이처지에 실렸고 네이처 온라인판에 요약글로 게시됐다. 독일 뮌헨에 소재한 헬름홀츠 인간 중심 AI 연구소에서 개발한 센타우르(Centaur)가 그 주인공이다.
센타우르를 개발한 연구진은 6만 명의 선발된 사람들이 다양한 과제에 걸쳐 1000만 건 이상의 선택을 한 160건의 심리학 실험을 통해 축적된 방대한 데이터 세트를 사용해 대규모언어모델(LLM)을 미세 학습했다고 한다.
대부분의 컴퓨터 모델과 인지 이론은 단일 과제에 국한된다. 예컨대 구글 딥마인드의 알파고는 전략 게임인 바둑만 둘 수 있으며, 전망 이론은 사람이 잠재적 손실과 이익 중 어떤 것을 선택할지 예측할 수 있다.
반면, 센타우르는 도박, 메모리 게임, 문제 해결 등 다양한 과제에서 인간의 행동을 시뮬레이션할 수 있다. 테스트 과정에서는 훈련되지 않은 과제에서도 사람들의 선택을 예측할 수 있었다. 네이처는 센타우르의 개발 과정을 상세히 설명하고 있다.
연구진은 이 시스템이 언젠가 인지 과학 분야에서 귀중한 도구가 될 수 있을 것으로 기대하고 있다. 연구진을 이끈 헬름홀츠 연구소의 인지 과학자 마르셀 빈츠는 게시글에서 “사람을 대상으로 실험을 하지 않고도 컴퓨터 시뮬레이션 상에서 실험을 수행할 수 있다”고 말했다. 그는 전통적인 연구 방식이 너무 느리거나, 아동이나 정신질환자처럼 모집하기 어려운 집단의 연구에 특히 도움이 될 수 있다고 덧붙였다.
노르웨이 과학기술대학의 심리언어학자 조수에 바지오는 “인지 과학에서 이론을 구축하는 건 매우 어려운 일”이라며 “이제 기계의 도움으로 어떤 결과를 도출할 수 있을지 기대된다”고 말했다.
과학자들은 오랫동안 특정 과제 중심의 모델로는 인간의 다양한 행동을 광범위하게 시뮬레이션하는 데 한계가 있다고 느껴왔다. 이는 그러한 모델들이 다양한 과제로 일반화하는 능력이 부족하기 때문이다.
빈츠 연구진은 이 한계를 극복하기 위해 노력했다. 그들은 미국 메타(Meta)가 공개한 대규모언어모델 라마(LLaMA)를 활용해 ‘Psych 101’이라는 심리학 분야의 방대한 행동 데이터 세트로 5일간 정밀 튜닝을 진행했다.
이 AI는 단순히 특정 과제에서 평균적인 인간 행동을 예측하는 것을 넘어서, 인구 집단 내에서 나타나는 전형적인 행동의 분포까지 예측하도록 설계됐다. 이후 훈련 데이터에 포함되지 않은 참가자들의 행동을 예측하는 테스트를 진행했다.
그 결과, 센타우르는 32개 과제 중 31개에서 라마 모델은 물론 다른 14개의 인지 및 통계 AI 모델보다 더 정확한 예측을 해냈다. 유일한 예외는 문법적으로 올바른 문장을 판단하는 과제였다.
센타우르는 훈련받았던 과제를 일부 변형한 형태의 과제는 물론, 전혀 다른 형태의 논리 추론 문제와 같은 새로운 과제에서도 뛰어난 성능을 보여주었다.
스탠퍼드 대학교의 인지신경과학자 러셀 폴드랙은 “이는 인간 행동이 매우 구조화되어 있음을 보여준다”며 “심리학이 목표로 삼아야 할 AI 모델 수준을 크게 끌어올렸다”고 평가했다.
연구진은 그러나 센타우르가 광범위한 능력을 갖췄음에도 불구하고, 여전히 일정한 한계는 존재한다고 지적했다. 대표적인 한 가지는 개발된 AI가 언어 기반 과제에만 의존하고 있다는 것이다. 특정 상황에서 사람이 어떤 선택을 할지는 예측할 수 있지만, 그 선택에 걸리는 시간은 예측할 수 없다는 것이다.
연구진은 현재 훈련 데이터 세트를 최대 4배 규모로 확장하는 작업을 진행 중이다. 다만 현재 대부분의 데이터는 선진국, 고학력, 산업화된 집단에서 수집된 것으로, 예측 결과가 다양한 인구 집단에는 적절히 적용되지 않을 수 있다는 점도 인정했다.
빈츠는 “센타우르는 현재 누구나 자유롭게 사용할 수 있으며, 다음 단계는 연구자 커뮤니티에 의한 외부 검증”이라고 밝혔다. 그는 이어 “지금의 센타우르는 아마 우리가 보게 될 가장 낮은 수준의 센타우르일 것이며, 앞으로는 계속 더 진보할 것”이라고 덧붙였다.


