텍스트를 AI 합성음으로 변환…빠르고 선명한 음질과 세밀한 속도‧볼륨 조절이 특징

코난테크놀로지가 AI 성우 서비스 ‘코난보이스’의 오픈 베타를 시작했다.
코난테크놀로지가 AI 성우 서비스 ‘코난보이스’의 오픈 베타를 시작했다.

[아이티데일리] 코난테크놀로지(대표 김영섬)는 대본 및 텍스트를 사람의 목소리처럼 자연스러운 인공지능(AI) 합성음으로 변환해주는 ‘코난보이스(Konan Voice)’ 오픈베타 서비스를 출시했다고 9일 밝혔다.

‘코난보이스’는 텍스트만 입력해도 합성음을 생성해 동영상에 더빙할 수 있는 서비스로, 코난테크놀로지의 개인화 음성생성 전문 AI 기술을 통해 개발됐다. 고속·고완성도 음성합성 기술을 토대로 사용자가 입력한 대본 또는 텍스트 문장을 빠르고 노이즈 없이 선명한 고음질로 전달한다.

특히 AI 보이스의 속도·볼륨을 세밀하게 조절할 수 있다는 점이 특징이다. 수십 분에서 2시간 미만의 음성 데이터를 개인화 음성으로 생성할 수 있으며, 몇 백초 길이의 음성파형을 0.1초 이내로 합성하는 것도 가능하다. 지연없는 고속 엔드-투-엔드(End-to-end) 합성기술이 적용돼, 사람이 직접 목소리를 녹음하고 후속 작업하는 번거로움을 줄여 누구나 쉽게 더빙 콘텐츠를 제작할 수 있다.

‘코난보이스’ 오픈베타 서비스는 웹사이트에서 회원가입 후 누구나 무료로 사용할 수 있다. 성인과 아이, 남성과 여성 등 총 18 종의 AI 보이스 모델을 선택하고 직접 디렉팅하여 음성 콘텐츠를 생성할 수 있다. 현재 코난테크놀로지는 기쁨과 슬픔, 분노, 희망 등 다양한 감정을 가진 음성모델을 추가 개발 중이다.

코난테크놀로지 유영욱 구독사업팀장은 “‘유튜브’, ‘틱톡’을 비롯해 동영상 콘텐츠 제작 수요가 날로 늘어가는 만큼 고품질 AI 목소리를 손쉽게 만나볼 수 있는 ‘코난보이스’ 오픈베타를 출시하게 돼 뜻깊다”면서, “개인 크리에이터의 콘텐츠 제작은 물론 기업의 요구에 따라 다양한 개인화 음성 또한 제작할 수 있을 것”이라고 말했다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지