그림=베이스캠프리서치
그림=베이스캠프리서치

[아이티데일리] 지난 2018년 구글의 AI 연구소 딥마인드는 단백질의 구조를 정밀하게 예측할 수 있는 알고리즘 알파폴드(AlphaFold)를 발표했다. 이는 큰 과학적 돌파구로 갈채를 받았고, 생물학에 선풍을 일으켰다.

단백질의 상호 작용을 이해하는 것은 생명공학 전반을 탐구하는 핵심이다. 알파폴드와 후속 모델인 알파폴드2가 지난 몇 년 동안 생성한 수억 개의 단백질 구조는 전 세계 생명공학 연구자들의 중요한 툴킷이 되고 있다.

그러나 알파폴드도 한계가 있었다. 합성 생물학의 궁극적인 목표는 AI가 그 모양을 기반으로 단백질을 생산하는 것이다. 런던에 본사를 둔 베이스캠프리서치(Basecamp Research)가 알파폴드2의 오픈소스 알고리즘 위에 구축한 새로운 AI 모델을 이용함으로써 이 목표에 한 걸음 다가갔다고 밝혔다고 포브스지가 보도했다. 회사가 개발한 모델은 베이스폴드(BaseFold)다

베이스폴드는 보다 광범위한 데이터 세트를 이용해 학습하고 있어 알파폴드2 보다 높은 정밀도로 단백질의 구조를 예측할 수 있다고 한다. 회사는 또 엔비디아와 협력, 베이스폴드의 최적화를 위해 자사의 신약 개발용 생성형 AI 플랫폼 바이오네모(BioNeMo)에서 이 모델을 사용할 수 있도록 한다는 방침이다.

단백질이 저분자 화합물과 상호작용했을 때의 구조 변화는 신약 개발 프로세스에서 중요한 데이터 포인트다. 베이스캠프의 CEO 글렌 가우어스에 따르면 회사의 소프트웨어는 단백질 구조를 종래의 3배의 정밀도로 예측할 수 있다고 한다. 피치북에 따르면, 회사는 지금까지 누계 2500만 달러를 조달했으며, 기업가치 평가액은 7100만 달러에 달한다.

현재 29세의 가우어스는 베이스폴드는 단백질이나 새로운 생물을 디자인한다는 그의 궁극적인 목표에 한 걸음 다가간 결과물이라고 밝혔다. 그는 "단지 단백질의 구조만을 예측하는 회사가 될 생각은 없다. 모든 단백질의 생성이나 예측에 적용할 것이다. 단백질의 기능 적응이나 새로운 단백질의 생성, 나아가 새로운 게놈의 생성에 도전할 것“이라고 말했다.

가우어스는 2019년, 동료들과 아이슬란드에서 한 달 동안 전기가 없는 생활을 했을 때 베이스캠프리서치 아이디어를 떠올렸다고 한다. 그들은 얼음과 온천이 가까이 있는 곳에 머물며 극한의 열과 추위 모두를 견딜 수 있도록 진화한 특수한 미생물의 게놈 배열 연구에 매진했다.

이들이 한 달 만에 수집한 데이터의 대부분은 '미지의 단백질과 배열로 기원도 불명한 물질'이었다. 그 결과 가우어스는 알파폴드의 학습에 사용된 게놈 데이터 세트가, 대서양의 전체의 생물종 가운데 물 5방울 정도의 양밖에 망라되어 있지 않다는 사실을 알았다고 한다.

생명을 구성하는 단백질의 기능을 예측하기 위해서는 방대한 양의 데이터가 필요하다. 그러나 너무 많은 요소가 영향을 미치기 때문에 복잡해지고, 계산하는 것은 불가능에 가깝다. 다만 수십억 개의 다른 구조로 훈련된 기계 학습 모델을 사용하면 보다 정밀한 예측이 가능해진다.

이러한 이유로 베이스캠프리서치는 모델을 학습하는 데 사용되는 단백질 데이터 세트를 다양 화하기 위해 노력해 왔다. 회사는 2020년 창업 이래 전 세계 연구자와 협력, 수천만 개의 미생물과 동식물로부터 취득한 고품질 게놈 정보를 해석해 왔다. 연구자들은 베이스캠프리서치가 데이터로 얻은 수익으로 로열티를 받는다.

연구자들은 DNA의 배열을 결정하는 동시에 단백질이 왜 그렇게 작동하는지를 파악하기 위해 필요한 생물의 서식 환경에 대한 데이터를 수집해 AI에 제공한다. 데이터에는 생물을 채취한 토지의 온도나 pH, 생물을 발견한 물의 염분 농도, 빛의 양 등이 포함된다. 샘플을 채취하는 장소는 특정 동굴에서 심해의 해양 분출구까지 다양하다.

가우어스에 따르면 회사는 예측 모델링을 사용해 고객의 문제를 해결함으로써 이미 매출을 올리고 있다. 영국 기업 킬러픽스와는 공동으로 독한 화학약품을 사용하지 않고도 직물을 염색할 수 있는 새로운 단백질을 설계하고 있다. 또 코네티컷주에 본사를 둔 스타트업 프로틴에볼루션(Protein Evolution)은 플라스틱을 분해하고 재활용할 수 있는 새로운 단백질의 발견에 활용하고 있다. 앞으로 제약회사와 협력, 신약을 개발한다는 계획이다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지