UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉
Валентин ШнайдерШІ
16 липня 2025, 10:14
2025-07-16
Mistral запустила Voxtral: першу відкриту ШІ‑модель для розпізнавання голосу з LLM‑підтримкою
Французький стартап Mistral анонсував аудіомодель з відкритим кодом, здатну не лише транскрибувати мовлення, а й аналізувати його зміст завдяки інтеграції з великою мовною моделлю.
Французький стартап Mistral анонсував аудіомодель з відкритим кодом, здатну не лише транскрибувати мовлення, а й аналізувати його зміст завдяки інтеграції з великою мовною моделлю.
Як повідомляє TechCrunch, модель Voxtral призначена для бізнес-інтеграцій і підтримує роботу з аудіо тривалістю до 30 хвилин. Завдяки зв’язку з LLM Mistral Small 3.1 вона може не лише розпізнавати мовлення, а й аналізувати його: наприклад, відповідати на запитання про зміст почутого, генерувати короткі самарі або виконувати голосові інструкції, такі як виклик API чи запуск функцій у програмі.
У моделі реалізована багатомовність: Voxtral підтримує англійську, іспанську, французьку, португальську, італійську, німецьку, голландську та гінді (української, на жаль, немає). Це дозволяє будувати локалізовані голосові інтерфейси та застосовувати її в різних регіонах.
Mistral пропонує три варіанти Voxtral:
Voxtral Small — 24 млрд параметрів, основна модель для масштабного продакшену.
Voxtral Mini — 3 млрд параметрів, оптимізована для локального або edge-використання.
Voxtral Mini Transcribe — спрощена версія для транскрипцій без семантичного аналізу, яка, за заявами компанії, випереджає OpenAI Whisper і коштує менше $0.001 за хвилину.
API вже доступний на Hugging Face, також тестування можливе в чаті Le Chat. Модель можна вбудовувати в вебсервіси, застосунки або корпоративні системи.
Запуск Voxtral є частиною стратегії Mistral щодо розвитку відкритих рішень у сфері ШІ. У червні компанія представила reasoning-модель Magistral, що розв’язує задачі шляхом покрокового логічного аналізу. А в липні TechCrunch повідомив, що стартап веде перемовини про залучення до $1 млрд інвестицій, зокрема з MGX Fund з Абу-Дабі.
Mistral позиціонує себе як відкрита альтернатива гравцям на кшталт OpenAI, Google і Meta, які розвивають закриті моделі з обмеженим доступом для розробників. Voxtral є першою спробою компанії вплинути на швидко зростаючий сегмент голосового ШІ, який досі залишався під контролем великих корпорацій.
Раніше ми писали, як Mistral запустив першу в Європі модель штучного інтелекту, яка використовує логічне мислення для створення відповіді. Таким чином французький стартап намагається не відставати від американських і китайських конкурентів.
Французький ШІ-стартап Mistral AI оновив свою модель для генерації кода: Codestral 25.01 набрала дивовижні 86,6% у тесті HumanEval, перевершивши своїх конкурентів
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.
Хочете повідомити важливу новину? Пишіть у Telegram-бот
Головні події та корисні посилання в нашому Telegram-каналі
https://ykuntsevych.medium.com/europes-data-vision-dataspaces-for-zero-trust-ai-infrastructure-92947ddb9602