딥마인드 AI 알파지오메트리2, 국제수학올림피아드 금메달 성적 넘어서
[아이티데일리] 구글 딥마인드(DeepMind)에서 1년 전 만든 AI 문제 해결사 알파지오메트리(AlphaGeometry)는 전 세계 영재 고등학생들을 대상으로 어려운 수학 문제를 푸는 최고 권위 대회 ‘국제 수학 올림피아드(IMO)’에서 은메달리스트 수준의 성과를 거두며 세상을 놀라게 한 바 있다.
그런 알파지오메트리가 더 발전한 모습으로 대중 앞에 모습을 드러냈다. 딥마인드 팀에 따르면 업그레이드된 알파지오메트리2 시스템의 성능이 IMO의 금메달리스트 수준을 넘어섰다고 네이처지 온라인판이 전했다. 딥마인드 팀은 테스트 결과를 arXiv1에 게재된 사전 인쇄본을 통해 설명했다.
임페리얼 칼리지 런던(Imperial College London)의 수학자 케빈 버자드는 네이처지에 "AI가 IMO에서 만점을 받는 데까지는 오래 걸리지 않을 것 같다"라고 말했다.
유클리드 기하학 문제를 푸는 것은 IMO에서 다루는 네 가지 주제 중 하나다. 다른 세 가지 주제는 정수론, 대수학 및 조합론 분야다. 기하학 문제는 AI의 특정 기술을 요구한다. 평면의 기하학적 물체에 대해 엄격하게 증명해야 하기 때문이다. 알파지오메트리2는 딥마인드가 IMO 문제 세트 가운데 비기하학 문제를 풀기 위해 개발한 AI 시스템 알파프루프(AlphaProof)와 함께 공개됐다.
알파지오메트리는 특수 언어 모델과 '신경 기호' 시스템을 포함하는 구성 요소의 조합으로 구성된다. 이 시스템은 신경망처럼 데이터에서 학습해 훈련하지 않지만, 인간이 코딩한 추상적 추론을 수행할 수 있다. 딥마인드 팀은 언어 모델을 공식적인 수학적 언어를 구사하도록 훈련시켰으며, 이를 통해 출력의 논리적 엄격성을 자동으로 확인하고 AI 챗봇의 불일치 또는 거짓 진술(환각이라고 한다)을 걸러낼 수 있다.
알파지오메트리2는 구글의 대규모언어모델(LLM) 제미나이(Gemini를 통합하고 여러 개선사항을 적용했다. 또한 AI가 평면 위 기하학적 물체를 움직여 추론할 수 있는 기능도 도입했다. 예를 들어, 선을 따라 점을 이동해 삼각형의 높이를 변경하고 선형 방정식을 풀 수 있다.
이 시스템은 지난 25년 동안 IMO에서 제출된 모든 기하학 문제 가운데 84%를 풀어냈다. 초기 버전인 알파지오메트리는 54%였다. 무려 30%포인트나 높아진 것이다. 인도와 중국의 영재 학생팀은 지난해 IMO에서 다른 접근 방식을 사용해 기하학 부문에서 금메달 수준의 성적을 냈지만, IMO 기하학 문제의 하위 집단은 더 적었다.
딥마인드 팀은 알파지오메트리의 향후 개선 사항과 관련, 부등식과 비선형 방정식을 포함한 수학 문제를 푸는 능력이 포함될 것이라고 밝혔다. 이는 기하학 문제를 더욱 완벽하게 풀기 위해 필요하다고 덧붙였다.
전체 시험에서 금메달을 획득하는 최초의 AI 시스템은 ‘AI 수학 올림피아드 상’으로 500만 달러의 상금을 받을 수 있다. 그러나 이 대회는 시스템이 오픈소스여야 한다. 딥마인드는 오픈소스가 아니다.
버자드는 알파지오메트리의 급속한 진전이 그리 놀라운 일은 아니라고 지적했다. 또 수학 문제가 어렵기는 하지만 주제는 여전히 개념적으로 단순하며, AI가 연구 수학 수준의 문제를 풀기까지는 극복해야 할 과제가 많다고 덧붙였다.
한편, 올해 IMO는 오는 7월 호주 선샤인 코스트에서 열린다. 문제가 공개되면 진정한 AI의 능력이 밝혀질 것으로 보인다. 새 문제는 기계학습 기반 시스템에 대한 가장 신뢰할 수 있는 테스트가 된다. 문제가 이전에 온라인에 존재하지 않았고, 학습 데이터 세트로 유출됐을 가능성도 없기 때문이다.