“이 연구는 사회에 어떤 영향을 미칠까”…결과 예측 AI 도구 나왔다
노스웨스턴대학교 연구진, ‘펀딩 더 프런티어’ AI 도구 개발 개별 연구나 특정 분야가 미래에 사회적 이익을 낳을 가능성 예측
[아이티데일리] 과학 연구는 사회에 다양한 이익을 제공한다. 그러나 특정한 한 연구가 사회에 실제로 어떤 영향을 미쳤는지, 또는 미칠지를 추적하는 일은 쉽지 않다. 연구비를 받아 작성된 논문은 각종 데이터베이스를 통해 쉽게 찾을 수 있지만, 그 연구가 정책 또는 헬스케어와 같은 영역,·산업 등 사회 전반에 미치는 영향을 추적하는 것은 어렵다.
그런 가운데, 연구의 사회적 영향을 광범위하게 예측하는 AI 모델이 등장해 관심을 모은다. 미국 노스웨스턴대학교 과학혁신연구센터 다순 왕 소장이 이끄는 연구진이 ‘펀딩 더 프런티어(Funding the Frontier)’라는 AI 도구를 개발했다. 이 도구의 프로토타입은 검증 받기 전 arXiv 서버에 소개됐으며 네이처지 온라인판이 게시글로 전했다.
이 도구는 연구 논문, 특허, 정책 보고서, 임상시험 데이터를 통합해 시각적인 연결 정보를 보여준다고 한다. 또 여기에 머신러닝 기반 예측 알고리즘을 결합해, 개별적인 연구나 특정한 분야가 미래에 가장 큰 사회적 이익을 낳을 가능성을 예측할 수 있게 했다. 예를 들어, 정책적인 연구비 지원이 특허로 이어질 가능성이 높은지를 미리 예측할 수 있는 것이다.
펀딩 더 프론티어에는 디멘션스(Dimensions), 알트메트릭(Altmetric), 오버톤(Overton) 데이터베이스, 그리고 연구진이 자체 구축한 사이사이넷(SciSciNet) 데이터 세트 등 네 개의 대규모 데이터 세트에서 추출한 엄청난 양의 데이터가 포함되어 있다. 총 700만 건의 연구비 지원, 1억 4,000만 건의 과학 논문, 1억 6,000만 건의 특허, 1,090만 건의 정책 문서, 80만 건의 임상시험, 그리고 580만 건의 뉴스 기사와 연결한다.
이 모든 자료는 2000년부터 2021년 사이에 출판되었으며, 이들 사이에는 18억 건의 인용 링크가 포함되어 있다. 이 데이터는 특정 연구에서 발생한 영향을 보여주고, 연구 결과를 출처까지 추적하며, 연구 결과 간의 모든 연관성을 추적하는 등 다양한 방식으로 표시할 수 있다.
인디애나대학교 블루밍턴 캠퍼스의 과학학 분야 스타샤 밀로예비치는 “과학 연구의 프로세스를 실질적인 데이터로 전환하는 데 중요한 공백을 메울 수 있을 것”이라고 평가하고 “과학 연구는 정책이나 연구비 지원에 큰 영향을 미치지만, 실제로 활용할 수 있는 도구가 부족해 실질적 영향력이 제한적이었다”고 말했다. 밀로예비치는 “이 도구의 가장 큰 장점은 데이터 규모와 연결 능력에 있다”고 덧붙였다.
왕 소장은 개발된 AI 도구에 다양한 기관과 연구자들이 관심을 가질 것이라고 기대했다. 예를 들어, 연구비 지원기관은 자신들의 자금이 어떤 분야에서 가장 생산적인 성과를 냈는지 확인할 수 있고, 대학 행정가들은 소속 기관의 강점과 약점을 분석해 향후 투자 방향을 결정할 수 있다.
실제로 한 대형 미국 연구지원기관의 프로젝트 매니저는 이 도구를 이용해 자신들의 지원금이 가져온 사회적 영향을 처음으로 확인할 수 있었다. 그 결과, 자금이 지원된 프로젝트가 독일·영국·국제기구의 정책 문서에 인용되었다는 사실을 발견했다. 또 그는 일부 분야에서 여성 연구책임자의 비율이 현저히 낮은 성별 불균형이 존재함을 파악하고, 이를 추가 조사할 계획이라고 밝혔다.
논문에 포함된 또 다른 사용자는 생의학 연구에 투자하는 민간투자사 관계자였다. 그는 이 도구의 예측 기능에 주목했다. 분석 결과, 지난 20년간 알츠하이머병 연구 분야에서 가장 큰 임상적 성과는 질병의 생물학적 이해를 위한 연구에서 나왔지만, 앞으로 가장 큰 영향을 미칠 것으로 예측된 분야는 환자의 사회적 지원 시스템 연구였다. 이는 새로운 투자 기회를 시사한다는 해석을 낳았다.
그러나 이 같은 예측 기능 자체가 우려를 낳기도 한다. 런던대학교 연구정책학자 제임스 윌슨은 이러한 알고리즘이 ‘자기충족적 예언(self-fulfilling prophecy)’을 낳을 수 있다고 우려한다. 즉, 과거의 성공 사례를 근거로 보수적인 투자나 정책 결정을 내리게 되어 미래의 잠재력을 저해할 위험이 있다는 것이다. 그는 “이런 예측 분석 도구는 신중히 접근해야 하며, 연구비 지원 기관이나 정책 입안자들이 채택하기 전에 충분한 검증이 필요하다”고 말했다.
이에 대해 왕 소장은 “예측 알고리즘이 인간의 전문성을 대체하려는 것이 아니다”라고 강조했다. “핵심 가치는 데이터가 제공하는 정보를 바탕으로 각자가 스스로 판단하고 결정을 내릴 수 있게 한다는 점이다”라는 것이다.
왕은 “현재 ‘펀딩 더 프론티어’가 ‘개념 증명’ 단계에 있으며, 앞으로 다른 연구자들이 이를 발전시켜 특정 연구 프로젝트의 사회적 가치를 정량적으로 입증하는 기반 도구로 발전시키길 기대한다”고 말했다.