글로벌 퍼블릭 클라우드, 엣지 컴퓨팅 및 엣지 AI 전문기업 지코어(Gcore)는 빠른 속도는 물론 비용 효율성을 높인 ‘지코어 AI 자동 음성인식 서비스(Gcore AI ASR: Gcore AI Automated Speech Recognition)’를 선보인다고 19일 밝혔다.
지코어에 따르면 AI 자동 음성인식 서비스는 지코어의 워크플로우에 통합되어, 데이터의 빠른 전달 속도가 매우 중요한 방송사, 주문형 비디오(VOD), 라이브 스트리밍 및 콘텐츠 소유자가 전세계 시청자에게 신속하게 도달할 수 있도록 지원한다.
또한 100개 이상의 언어를 지원하는 관리형 클라우드 서비스로, 다른 언어를 사용하거나 청각 장애가 있는 사용자들도 생성된 자막을 통해 콘텐츠 접근성을 높일 수 있다.
기존의 자동 음성인식 서비스는 속도가 느리고, 비용이 많이 들어 콘텐츠 제작자와 소유자에게 상당한 비용 부담이 됐다. 기존의 자막 생성은 여러 언어가 포함된 경우 몇 시간 또는 며칠씩 걸리기도 했다.
하지만 지코어 AI 자동 음성인식 서비스는 1시간 분량의 동영상 자막을 10분 이내 생성하며, 일반적인 단어 사용에 대한 오류도 4~5%로 낮게 나타나는 등 정확도가 사람이 생성한 것과 유사하거나 더 높다.
뿐만 아니라 여기에 특정 언어 또는 주제 영역에 대한 오픈소스 자동 음성인식 서비스 모델을 선택함으로써 자막을 생성할 콘텐츠에 대한 정확도를 더 높일 수 있다. 이러한 사용자 지정 방식은 산업별 용어나 여러 언어를 사용하는 콘텐츠에 유리하다.
이를 위해 지코어 AI 자동 음성인식 서비스는 새롭게 출시되고 업데이트되는 자동 음성인식 모델을 내부적으로 엄격히 평가해 고객이 사전 구성된 서비스를 통해 최상의 옵션을 사용할 수 있도록 보장한다.
직접 테스트를 거친 최고의 자동음성인식 모델을 한 곳에서 만나볼 수 있도록 지원함으로써 고객은 직접 모델을 선택하거나 조정할 필요 없이 콘텐츠의 빠른 자막 생성에만 집중할 수 있다.
또한 고객이 원할 경우 지코어의 서비스 팀은 고객이 특정 자동음성인식 모델을 선택하고 미세조정을 통해 특정 요구사항을 충족할 수 있도록 지원한다.
알렉세이 페트로브스키크 지코어 스트리밍 플랫폼 헤드는 "전세계 시청자에게 영상 콘텐츠를 제공하는 데 있어 자막은 매우 중요한 요소”라며 “지코어 AI 자동 음성인식 서비스, AI ASR은 방송사는 물론 콘텐츠 소유자 및 기업이 신선하고 접근하기 쉬운 콘텐츠로 세계 곳곳의 시청자에게 도달할 수 있도록 비용 효율적이고 정확한 방법을 제공한다”고 말했다.
지코어 AI 자동 음성인식 서비스는 현재 상용 중이다. 자세한 내용은 지코어 홈페이지(gcore.com/news/ai-asr-service)에서 확인할 수 있다.