😍 Спробуй Новий Trustee Plus на дотик - твій криптогаманець і платіжна картка тут 👉

ШІ-стартап ElevenLabs запустив модель Scribe, яка перетворює голос у текст і підтримує українську мову з «відмінною точністю»

ElevenLabs, стартап у сфері штучного інтелекту, який має оцінку в $3,3 млрд, і чий продукт використовувався для дубляжу інтерв’ю президента Володимира Зеленського блогеру зі США Лексу Фрідману, запустив нову самостійну модель Scribe. У ній є підтримка української, яка входить до переліку мов з найменшим відсотком помилок.

Залишити коментар
ШІ-стартап ElevenLabs запустив модель Scribe, яка перетворює голос у текст і підтримує українську мову з «відмінною точністю»

ElevenLabs, стартап у сфері штучного інтелекту, який має оцінку в $3,3 млрд, і чий продукт використовувався для дубляжу інтерв’ю президента Володимира Зеленського блогеру зі США Лексу Фрідману, запустив нову самостійну модель Scribe. У ній є підтримка української, яка входить до переліку мов з найменшим відсотком помилок.

Як повідомляє TechCrunch, модель Scribe від ElevenLabs на релізі підтримує понад 99 мов. Понад 25 мов компанія відносить до категорії «відмінної точності» моделі, де частота помилок у словах становить менш як 5%. До цього списку входять англійська, українська, французька, німецька, хінді, індонезійська, японська, польська, португальська, іспанська, в'єтнамська та інші.

Інші мови розподілені за різними категоріями:

  • з високою точністю — від 5% до 10% помилок у словах;
  • хорошою точністю — від 10% до 20% помилок у словах;
  • помірною точністю — від 25% до 50% помилок у словах.

Компанія заявила, що модель перевершила Google Gemini 2.0 Flash і Whisper Large V3 у тестах FLEURS і Common Voice на різних мовах.

ElevenLabs розробила компонент перетворення мови в текст для своєї платформи розмовних агентів зі штучним інтелектом, яка була випущена минулого року. Однак це перший випадок, коли компанія випускає окрему модель розпізнавання мови. 

«Ми хочемо краще розуміти, що ви говорите в розмові. Ми працюємо над тим, щоб відійти від простого генерування контенту і перейти до розуміння та транскрибування мови. Багато хто каже, що перетворення мови в текст — це вирішена проблема. Але для багатьох мов це дуже погано. Ми вважаємо, що можемо створити кращі моделі розпізнавання мовлення, тому що у нас є внутрішні команди, які коментують дані й надають нам швидкий фідбек», — сказав генеральний директор Маті Станішевскі.

Скриншот зі сторінки української мови в Scribe

Модель також має інтелектуальну діалогізацію спікерів, щоб вказати користувачу, хто саме говорить, позначку часу на рівні слів для точних субтитрів і автоматичне тегування звукових подій, таких як сміх аудиторії. Стартап надає клієнтам можливість безпосередньо транскрибувати відеоконтент для додавання субтитрів або титрів у своїй студії.

Наразі Scribe працює лише з попередньо записаними аудіоформатами. Компанія заявила, що незабаром випустить версію моделі з низькою затримкою в режимі реального часу. Це означає, що вона ще не є ефективною для транскрипції зустрічей або голосових нотаток.

Scribe коштує у $0,40 за годину транскрибованого аудіо. Хоча ця ціна є конкурентоспроможною, деякі з її конкурентів пропонують нижчу ціну за аудіо транскрипцію з певною диференціацією функцій, відзначає TechCrunch.

Нагадаємо, що у 2023 році стартап ElevenLabs, який створює універсальну машину для дубляжу зі штучним інтелектом, додав підтримку понад 20 мов. Серед них була українська, польська, гінді, португальська, іспанська, японська та арабська.

Наприкінці січня 2025 року ElevenLabs залучив $180 млн під час нового раунду фінансування і потроїв свою оцінку до $3,3 млрд. Раунд фінансування серії C спільно очолили Andreessen Horowitz та Iconiq Growth за участю додаткових нових інвесторів NEA, World Innovation Lab, Valor, Endeavor Catalyst Fund і Lunate.

Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Голосовий ШІ-стартап ElevenLabs який переклав інтерв’ю Зеленського Лексу Фрідману залучив $180 млн
Голосовий ШІ-стартап ElevenLabs, який переклав інтерв’ю Зеленського Лексу Фрідману, залучив $180 млн
По темi
Голосовий ШІ-стартап ElevenLabs, який переклав інтерв’ю Зеленського Лексу Фрідману, залучив $180 млн
росія використовувала ШІ-генератор голосів ElevenLabs щоб підірвати європейську підтримку України
росія використовувала ШІ-генератор голосів ElevenLabs, щоб підірвати європейську підтримку України
По темi
росія використовувала ШІ-генератор голосів ElevenLabs, щоб підірвати європейську підтримку України
Стартап ElevenLabs який робить дубляж за допомогою ШІ додав підтримку української мови
Стартап ElevenLabs, який робить дубляж за допомогою ШІ, додав підтримку української мови
По темi
Стартап ElevenLabs, який робить дубляж за допомогою ШІ, додав підтримку української мови
Підключай Megogo зі знижками за акційними тарифами.

від 99 гривень на місяць

Mazda
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті. 

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.