Реклама партнера — Название партнёра
UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

Mistral запустила Voxtral: першу відкриту ШІ‑модель для розпізнавання голосу з LLM‑підтримкою

Французький стартап Mistral анонсував аудіомодель з відкритим кодом, здатну не лише транскрибувати мовлення, а й аналізувати його зміст завдяки інтеграції з великою мовною моделлю.

1 коментар
Mistral запустила Voxtral: першу відкриту ШІ‑модель для розпізнавання голосу з LLM‑підтримкою

Французький стартап Mistral анонсував аудіомодель з відкритим кодом, здатну не лише транскрибувати мовлення, а й аналізувати його зміст завдяки інтеграції з великою мовною моделлю.

Як повідомляє TechCrunch, модель Voxtral призначена для бізнес-інтеграцій і підтримує роботу з аудіо тривалістю до 30 хвилин. Завдяки зв’язку з LLM Mistral Small 3.1 вона може не лише розпізнавати мовлення, а й аналізувати його: наприклад, відповідати на запитання про зміст почутого, генерувати короткі самарі або виконувати голосові інструкції, такі як виклик API чи запуск функцій у програмі.

У моделі реалізована багатомовність: Voxtral підтримує англійську, іспанську, французьку, португальську, італійську, німецьку, голландську та гінді (української, на жаль, немає). Це дозволяє будувати локалізовані голосові інтерфейси та застосовувати її в різних регіонах.

Mistral пропонує три варіанти Voxtral:

  • Voxtral Small — 24 млрд параметрів, основна модель для масштабного продакшену.
  • Voxtral Mini — 3 млрд параметрів, оптимізована для локального або edge-використання.
  • Voxtral Mini Transcribe — спрощена версія для транскрипцій без семантичного аналізу, яка, за заявами компанії, випереджає OpenAI Whisper і коштує менше $0.001 за хвилину.

API вже доступний на Hugging Face, також тестування можливе в чаті Le Chat. Модель можна вбудовувати в вебсервіси, застосунки або корпоративні системи.

Запуск Voxtral є частиною стратегії Mistral щодо розвитку відкритих рішень у сфері ШІ. У червні компанія представила reasoning-модель Magistral, що розв’язує задачі шляхом покрокового логічного аналізу. А в липні TechCrunch повідомив, що стартап веде перемовини про залучення до $1 млрд інвестицій, зокрема з MGX Fund з Абу-Дабі.

Mistral позиціонує себе як відкрита альтернатива гравцям на кшталт OpenAI, Google і Meta, які розвивають закриті моделі з обмеженим доступом для розробників. Voxtral є першою спробою компанії вплинути на швидко зростаючий сегмент голосового ШІ, який досі залишався під контролем великих корпорацій.

Раніше ми писали, як Mistral запустив першу в Європі модель штучного інтелекту, яка використовує логічне мислення для створення відповіді. Таким чином французький стартап намагається не відставати від американських і китайських конкурентів.

Підтримує понад 80 мов програмування: Mistral випустив помічника для вайб-кодингу Mistral Code
Підтримує понад 80 мов програмування: Mistral випустив помічника для вайб-кодингу Mistral Code
По темi
Підтримує понад 80 мов програмування: Mistral випустив помічника для вайб-кодингу Mistral Code
Французький ШІ-стартап Mistral представив нову ШІ-модель Devstral для програмування
Французький ШІ-стартап Mistral представив нову ШІ-модель Devstral для програмування
По темi
Французький ШІ-стартап Mistral представив нову ШІ-модель Devstral для програмування
Французький ШІ-стартап Mistral AI оновив свою модель для генерації кода: Codestral 25.01 набрала дивовижні 866% у тесті HumanEval перевершивши своїх конкурентів
Французький ШІ-стартап Mistral AI оновив свою модель для генерації кода: Codestral 25.01 набрала дивовижні 86,6% у тесті HumanEval, перевершивши своїх конкурентів
По темi
Французький ШІ-стартап Mistral AI оновив свою модель для генерації кода: Codestral 25.01 набрала дивовижні 86,6% у тесті HumanEval, перевершивши своїх конкурентів
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
3 коментарі
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
2 коментарі
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті. 

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі