“텍스트에서 오디오로”…음성 AI 모델 학습 지원하는 스타트업 각광
Y 컴비네이터 출신 ‘데이비드 AI’ 설립 1년도 안 돼 기업가치 1억 달러 돌파 LLM 학습 위한 데이터 태부족, 이를 음성 데이터가 보충
[아이티데일리] 오디오 데이터를 관리해 음성 AI 학습을 지원하는 스타트업 데이비드 AI(David AI)가 설립 1년도 채 되지 않아 기업가치 1억 달러를 돌파했다. 대규모언어모델(LLM)의 학습 범위가 텍스트에서 음성 쪽으로 외연을 넓힌 데 따른 자연스러운 결과다.
데이비드 AI는 세계에서 가장 저명한 스타트업 엑셀러레이터(초기 창업 지원 프로그램)인 ‘Y 컴비네이터’의 2024년 여름 프로그램에 선정된 유망 스타트업이다.
Y 컴비네이터는 폴 그레이엄, 제시카 리빙스턴, 로버트 모리스, 트레버 블랙울 등에 의해 미국 실리콘밸리에서 지난 2005년 설립됐다. Y 컴비네이터는 매년 2회, 전 세계에서 스타트업을 선발, 3개월간 집중 육성하는 프로그램을 운영한다.
이 프로그램에 선발되면 우선 50만 달러 규모의 초기 자금 지원이 이루어지고. 업계 최고의 전문가 네트워킹을 통해 비즈니스 및 투자 유치를 돕는다. Y 컴비네이터 프로그램을 졸압한 대표적인 스타트업은 에어비앤비, 드롭박스, 레딧, 스트라이프, 코인베이스, 인스타카트 등 글로벌 명성을 쌓은 기업들이 즐비하다.
데이비드 AI도 빠른 속도로 유명세를 따라잡기 시작했다.
AI 모델 학습에는 막대한 양의 데이터가 필요하다. 데이비드 AI는 음성 AI 학습을 지원하기 위한 음성 데이터 공급업체로 빠르게 성장하고 있다. 회사의 홈페이지를 통해 공개하고 프보스 CNBC 등 다수의 외신이 보도한 지난 5월의 시리즈 A 투자 라운드는 이 회사를 일약 스타급의 위치로 올려놓았다. 회사 홈페이지에 따르면 이 라운드는 알트 캐피탈과 앰플리파이 파트너스가 주도했고, 퍼스트라운드 캐피탈, Y 컴비네이터, 박스그룹 등도 참여한 가운데 총 2500만 달러가 모였다. 데이비드 AI는 이번 투자를 통해 기업가치 1억 달러로 평가됐다.
공동 창업자인 토머 코헨과 벤 와일리는 모두 데이터 라벨링 전문 기업 스케일 AI(Scale AI) 출신이다. 특히 코헨은 맥킨지에서 비즈니스 애널리스트로 일하다가 프로젝트 리더로 승진한 후 신사업을 시작하던 중 창업을 결심했다고 한다.
코헨은 “AI의 궁극적 진화는 노트북이나 키보드 같은 인터페이스를 벗어나, 음성 등으로 통하는 현실 세계로 확장될 때 일어난다고 판단한다”고 말했다. 이 아이디어는 음성 AI 모델을 개발하는 AI 기업에게 고품질 오디오 데이터를 제공하는 스타트업으로 실현됐다.
이 분야는 수요가 매우 다양하면서도 전문성이 요구된다. 데이비드 AI는 현실 세계의 음성 데이터를 수집하고 가공하는 것뿐 아니라, 데이터 자체를 설계하고 제작하기도 한다. 현재까지 약 10만 시간 분량의 음성 데이터를 축적했으며, 여기에는 15개 이상의 언어 방언 및 억양 관련 메타데이터도 포함돼 있다.
AI 열풍은 뜨겁고 무한한 아이디어와 비즈니스가 쏟아지고 있지만, 데이비드 AI의 비즈니스 모델은 비교적 단순하다. 개인에게 보상을 주고 스크립트를 읽거나 대화를 하게 함으로써 음성 데이터를 수집하는 방식이다. 알고리즘이나 모델 개발에 집중하는 기존 AI 기업들과는 사뭇 다른 접근법이다.
그의 판단은 결국 적중했다. 시장이 그것을 말해 준다. 데이비드 AI는 창업 1년이 채 되지 않아 연간 매출이 1,000만 달러에 이를 정도로 성장했다. ‘매그니피슨트 세븐(Magnificent Seven)’이라 불리는 구글, 애플, 메타 등 7대 빅테크 기업 대부분을 고객사로 확보했다. 회사는 개별 고객사의 이름은 공개하지 않았지만, 이는 이미 기정 사실로 받아들여진다.
생성형 AI의 발전 단계를 보면, 오픈AI가 2022년 말 챗GPT로 불을 당긴 후 최근까지 텍스트 기반 AI가 주류였다. 이제는 누구나 AI를 음성으로 확장하는 방법을 찾고 있다. 데이비드 AI의 희소가치가 드러나는 대목이다. AI 기업들이 대규모 데이터 부족 문제에 직면해 있다는 점에서, 데이비드 AI는 더 큰 성장 잠재력을 지닌다는 평가다.