카이스트, AI 생성 댓글 감지 기술 ‘XDAC’ 개발

심리적 억제 장치로 작용…실시간 감시 시스템, 자동 대응 알고리즘 확대 기대

2025-06-24     권영석 기자

[아이티데일리] 카이스트(총장 이광형)는 전기및전자공학부 김용대 교수 연구팀이 국가보안기술연구소(국보연)와 협력해, 한국어 AI 생성 댓글을 탐지하는 기술 ‘XDAC’를 개발했다고 23일 밝혔다.

XDAC 데모, 탐지 및 식별 시연 예시 (출처=카이스트)

카이스트는 XDAC를 플랫폼 사업자가 의심스러운 계정이나 조직적 여론 조작 시도를 정밀 감시·대응하는 데 활용될 수 있으며, 향후 실시간 감시 시스템이나 자동 대응 알고리즘으로 확장될 것으로 기대하고 있다.

연구팀은 XDAC의 탐지 기술이 단순 판별을 넘어 심리적 억제 장치로도 작용할 수 있다고 설명했다. 마치 음주단속, 마약 검사, CCTV 설치 등이 범죄 억제 효과를 가지듯, 정밀 탐지 기술의 존재 자체가 AI 악용 시도를 줄일 수 있다는 것이다.

이번 연구는 설명 가능 인공지능(XAI) 기반 탐지 프레임워크를 제안한 것이 핵심이다. 연구팀은 △14종의 다양한 LLM 활용 △자연스러움 강화 △세밀한 감정 제어 △참조자료를 통한 증강 생성 등 네 가지 전략을 적용한 AI 댓글 생성 프레임워크를 개발했다. 이를 통해 AI 생성 댓글에 사람과 다른 고유한 말투 패턴이 있음을 확인했다.

예를 들어 AI는 ‘것 같다’, ‘에 대해’ 등 형식적 표현과 높은 접속어 사용률을 보였으며, 사람은 반복 문자, 감정 표현, 줄 바꿈, 특수 기호 등 자유로운 구어체 표현을 즐겨 사용했다. 특히 AI는 전 세계적으로 통용되는 표준화된 이모지를 주로 사용하는 반면, 사람은 한국어 자음이나 특수 기호 등 문화적 특수성이 담긴 다양한 문자를 활용했다.

연구팀은 이러한 차이를 정교하게 반영해 XDAC의 탐지 성능을 높였다. 줄 바꿈, 공백 등 서식 문자를 변환하고, 반복 문자 패턴을 기계가 이해할 수 있도록 변환하는 방식을 적용했다. 더불어 각 거대언어모델(LLM)의 고유 말투 특징을 파악해 어떤 AI 모델이 댓글을 생성했는지도 식별 가능하다.

한편 XDAC는 AI 생성 댓글 탐지에서 98.5% F1 점수로 기존 연구 대비 68% 성능을 향상시켰으며, 댓글 생성 LLM 식별에서도 84.3% F1 성능을 기록했다.

카이스트 고우영 선임연구원은 “이번 연구는 생성형 AI가 작성한 짧은 댓글을 높은 정확도로 탐지하고, 생성 모델까지 식별할 수 있는 세계 최초 기술”이라며 “AI 기반 여론 조작 대응의 기술적 기반을 마련한 데 큰 의의가 있다”고 강조했다.