MIT 연구진, 바이오테크 기업 셀러리티와 협업해 모델 개발
“AI가 스스로의 실험에서 학습하는 ‘스마트’한 스크리닝 시스템” 평가
[아이티데일리] 인간 세포에서 얻은 복잡한 데이터를 학습한 인공지능(AI) 모델이 새로운 약을 개발하는 경쟁에서 지름길을 제공할 수 있다는 연구가 나왔다. 이 연구는 MIT 생의학공학자 알렉스 샬렉(Alex Shalek) 교수 연구진과 매사추세츠주 서머빌의 바이오테크 기업 셀러리티(Cellarity)와 협업해 이루어졌다. 연구 결과는 사이언스지에 게재됐으며 논문 요약글은 네이처 온라인판에 게재됐다.
게시글에 따르면 이번 연구는 방대한 화합물 라이브러리를 일일이 검토해야 하는 지루하고 느린 신약 탐색 과정을 AI로 가속할 수 있을 것으로 기대된다. 지난 수십 년 동안 과학계는 거대한 화학물질 라이브러리를 기초로 하여 실험실에서 배양한 세포에 라이브러리에서 찾은 각 화합물을 적용해 그 효과를 관찰하는 방식으로 약물을 찾아왔다. 물론 과학계는 이 방식으로 암세포를 사멸시키는 화합물 등 실제 치료제를 발굴하고 상업화했지만, 약물을 찾아내는 과정이 매우 느리고 어려웠다.
최근 신약 개발자들은 단일세포 수준의 유전체(게놈) 데이터를 활용해 더 복잡한 스크리닝 방법을 구상하고 있다. 이론적으로는 이러한 방법이 특정 화합물이 유전자 네트워크 전체의 활성 패턴을 어떻게 교란시키는지를 평가할 수 있게 하며, 새로운 신약 후보를 찾는 길을 열어줄 수 있다.
그러나 샬렉 교수는 네이처지에서 “신약 발굴을 위해서는 보통 수만~수십만 개의 화합물을 스크리닝해야 하는데, 이를 복잡한 유전자 실험과 결합하기에는 너무 비용이 많이 들고 비효율적”이라고 말했다. 그래서 연구진은 약 9,600종의 화학물질이 50종 이상의 세포 유형에서 유전자 활성에 어떤 변화를 일으키는지에 대한 공개 데이터를 기반으로, 드러그리플렉터(DrugReflector)라는 딥러닝 AI 모델을 훈련시켰다.
드러그리플렉터 모델을 이용해 연구진은 혈소판과 적혈구 생성에 영향을 미칠 수 있는 화학물질들을 찾아냈다. 이는 일부 혈액 질환 치료에 유용할 수 있는 특성이다. 연구진은 이 중 107종의 화합물을 실제로 실험해 예측된 효과가 나타나는지를 검증했다.
결과적으로, 드러그리플렉터는 기존의 무작위 스크리닝 방식보다 최대 17배 높은 효율로 관련 화합물을 찾아냈다. 또한 1차 스크리닝 데이터를 다시 모델 학습에 반영하자, 성공률이 두 배로 향상됐다.
베이징대 세포생물학자 덩 홍쿠이 교수는 네이처에서 “이 연구는 미래를 위한 강력한 청사진”이라며 “AI가 스스로의 실험으로부터 학습하는 ‘스마트’한 스크리닝 시스템을 만들어냈다”고 평가했다.
휴스턴 텍사스대학교 MD 앤더슨 암센터의 데이터과학자 비산 알-라지카니는 “이 접근법은 신약 스크리닝에 필요한 인력과 시간을 획기적으로 줄일 수 있다”며 “수백만 개 대신 수백 개의 화합물만 실험해도 된다”고 말했다.
덩 교수는 이러한 기법이 자신의 연구실에도 도움이 될 것이라고 말한다. 그는 줄기세포를 인슐린 생성 세포로 전환(reprogramming)시키는 화합물을 찾기 위해 수년간 스크리닝을 수행해 왔다. 이 기술이 있다면 그 과정을 단축할 수 있다는 것이다. 다만 덩은 현재 드러그리플렉터가 학습에 사용된 9,600개 화합물에만 적용할 수 있으며, 완전히 새로운 분자를 발견할 수는 없다고 지적했다.
연구진의 궁극적인 목표는 화학 구조만으로 그 분자가 생물학적으로 어떤 효과를 낼지 예측하는 시스템을 만드는 것이다. 덩은 “현재 기술들은 매우 유망하지만, 정확도와 일반화 능력은 여전히 상당한 개선이 필요하다”고 덧붙였다.


