비디오 픽셀 내 인간 ‘혈류 흐름’ 분석해 밀리초 단위로 결과 표시

[아이티데일리] 인텔은 96%의 정확도로 가짜 동영상을 탐지할 수 있는 페이크캐쳐(FakeCatcher) 기술을 개발했다고 16일 밝혔다. 해당 기술은 인텔의 ‘책임있는 AI(Responsible AI)’ 노력의 일환으로 개발됐다. 인텔의 딥페이크 탐지 플랫폼은 세계 최초로 밀리초 단위 내로 분석 결과를 제공하는 실시간 딥페이크 탐지기다.

일케 데미르(Ilke Demir) 인텔 랩(Intel Labs) 수석 연구원은 “유명한 연예인이 실제로 하지 않은 행동이나 말을 하는 동영상을 본 적이 있을 것”이라며 “딥페이크 영상은 이제 어디에서나 접할 수 있다”고 말했다.

인텔이 정확도가 96%에 달하는 실시간 딥페이크 탐지 기술을 공개했다.
인텔이 정확도가 96%에 달하는 실시간 딥페이크 탐지 기술을 공개했다.

인텔이 공개한 실시간 딥페이크 탐지 기술은 인텔 하드웨어와 소프트웨어를 사용하며, 웹 기반 플랫폼을 통해 서버와 인터페이스 상에서 구동한다.

먼저 소프트웨어 측면을 살펴보면, 인텔은 다양한 전문 소프트웨어 도구를 사용해 최적화된 페이크캐쳐 아키텍처를 구성했다. 개발팀은 얼굴과 지형지물 감지 알고리즘을 위해 오픈비노(OpenVINO)를 사용해 AI 모델을 구동했다. 컴퓨터 비전 블록은 멀티 스레드 소프트웨어 라이브러리인 인텔 통합 성능 프리미티브(Intel Integrated Performance Primitives)와 실시간 이미지 및 영상 처리 도구인 오픈CV를 바탕으로 최적화했으며, 추론 블록은 인텔 딥러닝 부스트(Intel Deep Learning Boost)와 인텔 어드밴스드 벡터 익스텐션 512(AVX0512)로, 미디어 블록은 인텔 AVX2로 최적화했다. 이와 더불어 개발팀은 오픈 비주얼 클라우드(Open Visual Cloud) 프로젝트를 이용해 인텔 제온 스케일러블 프로세서 제품군을 위한 통합 소프트웨어 스택을 제공했다.

또한 하드웨어 측면에서 신규 딥페이크 탐지 플랫폼은 3세대 인텔 제온 스케일러블 프로세서 위에서 최대 72개 각자 다른 탐지 스트림을 구동할 수 있다.

대부분의 딥러닝 기반 탐지기는 원본 데이터를 확인 후, 비진위성의 징후를 찾고 영상의 문제를 식별한다. 반면 인텔 페이크캐쳐는 실제 인간의 요소, 즉 비디오 픽셀에서 나타나는 인간의 미묘한 ‘혈류’를 가늠해 실제 영상에서 단서를 확보한다. 심장이 혈액을 내보낼 때 정맥의 색이 변한다. 따라서 해당 탐지기는 원본 영상에서 나타나는 사람의 얼굴에서 혈류 신호를 수집하고, 알고리즘을 통해 시공간 지도로 변환한다. 이 후 딥러닝으로 영상의 진위를 즉시 판단할 수 있다.

딥페이크 영상의 위협은 점점 커지고 있다. 가트너(Gartner)에 따르면, 기업들은 사이버 보안 솔루션에 최대 1,880억 달러를 투자할 예정이다. 딥페이크 영상을 실시간으로 탐지하는 것도 쉽지 않다. 분석을 위해서는 탐지 애플리케이션에 영상을 업로드 한 뒤, 결과가 나오기까지 몇 시간이 소요되기 때문이다.

딥페이크로 인한 기만 행위는 매체 신뢰 하락과 같은 부정적인 결과를 초래할 수 있다. 페이크캐쳐는 사용자가 컨텐츠의 진위를 구별할 수 있게 지원함으로써 신뢰 회복을 도울 수 있다.

향후 페이크캐쳐를 활용할 사례를 몇 가지 예상해볼 수 있다. 소셜 미디어 플랫폼은 사용자들이 해로운 딥페이크 영상을 업로드 하는 것을 막기 위해 해당 기술을 활용할 수 있다. 글로벌 뉴스 매체는 조작된 영상을 실수로 보도하는 것을 방지하기 위해 해당 기술을 활용할 수 있다. 더불어, 비영리 단체들은 본 플랫폼을 활용해 모든 사람들이 사용할 수 있도록 딥페이크 탐지 기능을 공개할 수 있다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지