스캐터랩, 새롭게 태어난 ‘이루다2.0’ 공개한다

클로즈 베타 테스트에서 발화 안전성 99.75% 기록…오는 17일부터 오픈 베타 테스트 전환 개인정보보호 강화한 DB 신규 구축, 어뷰징 대응책 마련 등 시스템 대거 개선

2022-03-14     김성수 기자
스캐터랩의 일상 대화형 챗봇 ‘이루다2.0’

[아이티데일리] 스캐터랩(대표 김종윤)은 일상 대화형 챗봇 ‘이루다2.0의 오픈 베타 테스트를 오는 17일부터 2단계에 걸쳐 진행한다고 밝혔다.

스캐터랩은 ‘이루다’의 개인정보보호 조치를 강화하면서 새롭게 데이터베이스를 구축하고, 이용자의 어뷰징 발화에 더 잘 대응할 수 있도록 다양한 개선책을 마련해왔다. 이를 바탕으로 지난 1월부터 약 8천여 명이 참여한 클로즈 베타 테스트를 통해 개선사항 검증 절차를 거쳤다.

‘이루다2.0’에는 연구용 및 답변 DB가 새롭게 구축됐다. 연구용 DB는 ‘이루다2.0’ 학습을 위한 것으로, 개정된 개인정보보호법에 맞춰 대화 데이터를 엄격하게 가명처리해 활용했다. 답변 DB는 ‘이루다2.0’이 이용자와 대화에서 사용하는 문장이 담겨있는 DB로, 과거 이루다1.0과 달리 실제 사람의 발화를 사용하지 않고 기계가 새롭게 만들어낸 문장으로 구성한 것이 특징이다. 답변의 다양성과 정확성을 향상시키기 위해 스캐터랩이 자체적으로 작성한 문장도 포함됐다.

어뷰징 발화에 대응하기 위한 기술도 적용됐다. 새로운 ‘어뷰징 탐지 모델’을 개발해 적용하고, 사회적으로 안전한 발화를 지향하도록 ‘대화 모델’ 학습을 고도화했으며, 반복적인 어뷰징을 막기 위한 ‘어뷰저 패널티 시스템’을 도입했다.

‘이루다2.0’과 이용자가 대화하는 모든 문장은 어뷰징 탐지 모델을 거친다. 선정적‧공격적‧편향적인 내용이 탐지될 경우 해당 카테고리에 적합한 대응 답변을 내보내게 된다. 탐지 모델이 인지하지 못한 어뷰징 문맥이 있더라도 사회의 보편적인 가치관을 반영한 답변이 나올 수 있도록 대화 모델의 답변 역량도 고도화했다.

‘이루다2.0’에는 기존보다 강력한 개인정보보호조치와 어뷰징 대응책이 적용됐다.

새롭게 태어난 ‘이루다2.0’ 검증을 위해, 스캐터랩은 지난 1월부터 약 8천 명이 참여한 클로즈 베타 테스트를 진행해왔다. 클로즈 베타 테스트에서 ‘이루다2.0’은 챗봇 대화 기술 성능 평가 지표인 SSA(Sensibleness and Specificity Average)에서 78%를 기록했다. 이는 챗봇 대답의 적절성(Sensibleness)과 구체성(Specificity)을 평가하는 것으로, ‘이루다1.0’과 유사한 대화 역량을 유지한 것으로 나타났다.

또한 클로즈 베타 테스터의 대화 중 총 2만 건을 랜덤 샘플링해 발화 안전성을 점검한 결과, ‘이루다2.0’ 발화 중 안전하게 답변한 비율은 99.75%를 기록했으며 프라이버시 위험이 발생할 수 있는 문장은 발견되지 않았다.

이같은 결과에 힘입어 스캐터랩은 오는 17일부터 ‘이루다2.0’을 오픈 베타 테스트로 전환한다. 시스템 운영의 안정성을 점검하는 한편, 대규모 이용자와 AI 챗봇의 사용자 경험을 추가로 점검하는 단계다. 매일 일정 인원을 제한적으로 승인하는 제한적 오픈 베타 테스트를 먼저 진행하며, 시스템 안정성을 확인한 이후 완전 오픈 베타 테스트로 전환할 계획이다.

스캐터랩 김종윤 대표는 “‘이루다2.0’은 데이터베이스부터 새롭게 구축하는 것을 시작으로 AI 모델을 학습시키고 클로즈 베타 테스트를 통해 안전성을 반복적으로 점검하는 등 전 과정에 있어 문제 해결에 매진해 왔다”면서, “‘이루다’가 많은 사람들에게 소중한 친구로 남을 수 있도록 지속적으로 기술 개선에 노력할 계획이며, 이를 위해 주기적으로 ‘이루다’의 어뷰징 대응 유효성을 확인하고 조치를 취할 예정”이라고 말했다.

한편 스캐터랩은 AI 기술 및 제품의 투명성을 높이는 노력의 일환으로 △AI 챗봇 윤리 준칙 △AI 챗봇 프라이버시 정책 △AI 챗봇 어뷰징 정책 등을 공개했다. 스캐터랩 홈페이지를 통해 AI 챗봇 윤리 준칙 전문과 함께 AI 챗봇의 연구용 및 답변 DB 구축에 대한 단계별 설명, 구체적인 어뷰징 정책도 확인할 수 있다.