100개 이상의 언어 지원하는 관리형 클라우드 서비스 제공
[아이티데일리] 퍼블릭 클라우드 및 엣지 인공지능(AI) 전문기업 지코어(Gcore)는 속도와 비용 효율성을 높인 ‘지코어 AI 자동 음성인식 서비스(Gcore AI ASR: Gcore AI Automated Speech Recognition)’를 선보인다고 19일 밝혔다.
지코어 AI 자동 음성인식 서비스는 지코어의 워크플로우에 통합돼 데이터의 빠른 전달 속도가 매우 중요한 방송사, 주문형 비디오(VOD), 라이브 스트리밍 및 콘텐츠 소유자가 전 세계 시청자에게 신속하게 도달할 수 있도록 지원한다. 또한 100개 이상의 언어를 지원하는 관리형 클라우드 서비스로, 다른 언어를 사용하거나 청각 장애가 있는 사용자들도 생성된 자막을 통해 콘텐츠 접근성을 높일 수 있도록 돕는다.
회사 측에 따르면, 지코어 AI 자동 음성인식 서비스는 1시간 분량의 동영상 자막을 10분 이내에 생성하며, 일반적인 단어 사용에 대한 오류도 4~5%로 낮게 나타나는 등 정확도가 사람이 생성한 것과 유사하거나 더 높다.
뿐만 아니라 특정 언어 또는 주제 영역에 대한 오픈소스 자동 음성인식 서비스 모델을 선택함으로써 자막을 생성할 콘텐츠에 대한 정확도를 더 높일 수 있다. 이러한 사용자 지정 방식은 산업별 용어나 여러 언어를 사용하는 콘텐츠에 유리하다는 게 회사 측 설명이다.
이를 위해 지코어 AI 자동 음성인식 서비스는 새롭게 출시되고 업데이트되는 자동 음성인식 모델을 내부적으로 평가하고 고객이 사전 구성된 서비스를 통해 최상의 옵션을 사용할 수 있도록 지원한다. 직접 테스트를 거친 최고의 자동음성인식 모델을 한 곳에서 만나볼 수 있도록 지원함으로써 고객은 직접 모델을 선택하거나 조정할 필요 없이 콘텐츠의 빠른 자막 생성에만 집중할 수 있다.
또한 고객이 특정 자동음성인식 모델을 선택하고 미세조정을 원할 경우, 지코어의 서비스 팀이 특정 요구사항을 충족할 수 있도록 지원한다.
지코어의 알렉세이 페트로브스키크 스트리밍 플랫폼 헤드는 “전 세계 시청자에게 영상 콘텐츠를 제공하는 데 있어 자막은 매우 중요한 요소”라며 “지코어 AI 자동 음성인식 서비스, AI ASR은 방송사는 물론 콘텐츠 소유자 및 기업이 신선하고 접근하기 쉬운 콘텐츠로 세계 곳곳의 시청자에게 도달할 수 있도록 비용 효율적이고 정확한 방법을 제공한다. 이는 지코어의 솔루션과 엣지 인프라의 지속적인 혁신을 위한 또 다른 진전이 될 것”이라고 말했다.