AI, 환자 목소리로 질병 판별한다 – 음성 바이오마커 가능성 ↑

제2형 당뇨병, 파킨슨병, 심장병, 폐경 등 다양한 질병을 목소리로 진단 AI 모델 도움으로 발병 수년 전부터 예측하고 예방 가능

2025-06-02     조민수 기자
이미지=픽사베이

[아이티데일리] 미국 플로리다대학(USF)의 이비인후과 전문의 야엘 벤수산 박사는 환자의 말을 듣기만 하고도 그가 심장병으로 인한 폐부종을 앓고 있다는 사실을 알아차렸다. 환자는 호흡이 짧아 음을 오래 내지 못했는데, 이는 폐에서 충분한 공기가 나오지 않음을 의미했다. 실제로 이 환자는 폐부종으로 인해 폐에 1리터의 물이 고여 있었다.

벤수산 박사와 연구팀은 자신의 진단과 치료 경험을 바탕으로 AI를 활용, 사람의 목소리에서 질병의 징후를 포착하는 연구를 진행 중이라고 네이처지가 온라인판을 통해 전했다. 그녀는 "보통 진료실에 들어가 환자의 목소리만 들어도 어떤 질환인지 알 수 있다"고 말한다. 이를 AI 에이전트가 대신하도록 한다는 것이다.

이 프로젝트를 통해 연구팀은 파킨슨병, 당뇨병, 관상동맥질환, 폐경 등 사람들의 다양한 건강 상태에 대한 음성 바이오마커를 찾아낸다는 계획이다.

◆ 음성의 생리학적 기반

사람의 목소리는 폐와 후두에서 발생하며, 턱, 혀, 입술이 이를 말소리로 형성한다. 뇌는 언어의 내용을 통제한다. 따라서 신체 또는 정신의 이상은 목소리에 고유한 특징(‘음성 서명’ 또는 ‘바이오마커’)을 남긴다.

예를 들어, 폐경은 호르몬 변화로 성대의 수분과 콜라겐 감소를 일으켜 목소리를 거칠게 하고 음역대를 낮춘다. 파킨슨병은 말소리의 음높이와 크기의 변화가 줄어드는 단조로운 목소리로 나타나며, 혀와 턱 근육의 미세한 조절력 저하로 인해 발음도 부정확해진다.

노스이스턴 대학교의 언어 및 언어 병리학자 루팔 파텔은 음성은 신체의 생리적 변화에 매우 민감한 음향 기기라고 말했다. 음성에는 측정 가능한 모든 종류의 음향 특성이 있다는 것이다. 예를 들어 심장 질환으로 인해 발생할 수 있는 체액 저류는 성대의 질량을 증가시킨다. 성대를 더 천천히 진동하게 해 목소리의 음정을 낮춘다. 심장병은 호흡 곤란을 초래할 수 있다. 이는 화자들이 폐에서 충분한 공기를 밀어내는 데 어려움을 겪기 때문이다.

이러한 변화는 질병이 본격적으로 진행되기 10년 전부터 나타날 수 있다. AI 모델의 도움으로 이러한 징후를 찾아내어 선별, 조기 진단 및 원격 건강 모니터링이 가능해진다.

◆ AI의 진단 능력

AI는 이러한 미묘한 음성의 변화를 감지하는 데 매우 유용하다. 룩셈부르크 보건연구소는 AI를 이용해 약 600명의 음성 데이터를 분석한 결과, 제2형 당뇨병 환자를 남성의 경우 71%, 여성의 경우 66% 정확도로 구별해냈다.

이는 고혈당으로 인한 부종이나 신경 손상이 음성에 영향을 미친 것으로 추정된다. 심장병 역시 성대의 질량 증가와 숨가쁨으로 인해 목소리에 변화가 생기며, AI는 이를 포착할 수 있다.

벤수산 박사는 그러나 AI도 단일 증상만으로 질병을 진단하는 것은 어렵다고 지적한다. 여러 질환이 동시에 존재할 수 있기 때문이다. 예를 들어, 폐경을 겪고 있는 파킨슨병 환자의 목소리는 두 질환의 징후를 함께 반영하므로 AI는 이를 분리해 내야 한다. 또한, 아직 AI가 감지한 음성 패턴이 실제 생리학적 변화와 어떻게 연결되는지는 명확히 밝혀지지 않은 경우도 있다.

◆ 정신 건강 평가로의 확장

음성은 신체 건강뿐 아니라 정신 건강 상태도 반영한다. 우울증 환자는 일반적으로 말이 느리고 음량이 작으며, 부정적이고 단정적인 표현을 자주 사용한다. AI는 이러한 특성과 더불어 ‘음성 떨림(jitter)’ 같은 음향적 요소를 분석해 우울증의 조기 신호를 감지할 수 있다.

콜로라도대학의 피터 폴츠 교수는 정신 질환자들의 언어 상태를 평가하는 앱을 개발해, AI를 통해 언어의 속도, 리듬, 볼륨 등을 정량화했다. 이런 기술은 전문의 부족 문제를 보완하고 장기적으로 환자의 정신 상태를 모니터링하는 데 도움을 줄 수 있다.

보스턴대학의 이오아니스 파스칼리디스 교수는 경도인지장애 환자들의 목소리를 분석, 6년 이내 알츠하이머로 진행될 사람을 약 80% 정확도로 예측하기도 했다. 이 연구는 음향보다는 화자의 언어 내용 분석에 집중했으며, 이는 음성 AI 분석의 새로운 가능성을 제시했다.

◆ 장기 데이터 수집의 필요성과 윤리적 고려

정확한 진단을 위해서는 장기간에 걸친 음성 데이터 수집이 필수적이다. 개인의 평소 음성 상태(기준선)가 없으면 특정 음성 패턴이 질병의 징후인지, 단순한 개인차인지 구분하기 어렵다.

이를 해결하기 위해 2022년 벤수산 박사는 미국 국립보건원(NIH)과 함께 ‘건강의 바이오마커로서의 음성’ 프로젝트를 시작했다. 이 프로젝트를 통해 1만 명의 음성 데이터를 수집, AI 학습용 공개 데이터베이스를 구축하고 있으며, 참가자들은 읽기, 자유 대화, 기침 등 20가지 과제를 수행한다.

그러나 음성 데이터는 개인정보를 포함할 수 있어 윤리적 문제가 따른다. 연구진은 원음 대신 스펙트로그램(음성의 시각적 표현)을 제공했지만, 일부 연구자가 이를 음성으로 복원하는 알고리즘을 개발해 음성를 다시 들을 수 있게 되었다. 이에 따라 프로젝트는 자유 음성을 제외하고, 사전 승인된 문장만 수집하도록 변경됐다.

또한, AI가 담배 흡연 여부나 정신 건강 상태를 음성으로 판별할 수 있다면, 환자가 원치 않는 정보를 의사에게 노출하게 될 가능성도 있다. 이는 진료의 신뢰를 해칠 수 있어 주의가 필요하다.

◆ 앞으로의 전망

음성 바이오마커 기술은 이미 일부 기업에서 의사 결정 보조 시스템 형태로 상용화되고 있다. 그러나 진단 도구로 사용되기 위해서는 미국 식품의약국(FDA) 승인을 받아야 하며, 현재까지 승인을 받은 사례는 없다.

벤수산 박사는 향후 3~5년 내에 병원 현장에서 음성 기반 AI 기술이 점점 더 널리 쓰일 것으로 예상하지만, 그 성공 여부는 여전히 ‘작동 여부’에 달려 있다고 지적했다.