Gemini може розшифровувати аудіо та відео в текст, зокрема й безплатна версія. Експерт порадив, як цим користуватися
У ШІ-сервісі Gemini можна завантажувати аудіо та відео для розшифровки у текстовий формат.
У ШІ-сервісі Gemini можна завантажувати аудіо та відео для розшифровки у текстовий формат.
У ШІ-сервісі Gemini можна завантажувати аудіо та відео для розшифровки у текстовий формат.
Про це на своїй сторінці у Facebook повідомив ШІ-експерт Олексій Мінаков.
«У платній версії Gemini за $20/місяць можна транскрибувати аудіо аж до трьох годин! А відео — до 1 години. У безоплатній версії можна розшифровувати аудіо до 10 хвилин, а відео — до 5 хвилин», — зазначив він.
Мінаков також відзначив швидкість, з якою Gemini виконує це завдання.
«Найголовніше, що мені сподобалося, це швидкість розшифровки. Миттєва! Не жартую — 2-годинне аудіо розшифрувало за декілька секунд. Плюс, в одному запиті можна додати аж до 10 файлів!», — додав ШІ-експерт.
Як писав dev.ua, нещодавно Google суттєво оновила свій генератор відео на базі штучного інтелекту Veo 3 та його пришвидшену версію Veo 3 Fast. Компанія зменшила ціни на створення контенту, а також додала можливість генерувати вертикальні ролики у співвідношенні 9:16 і відео у роздільності 1080p HD.
Окрім того, компанія Google покращила генерування зображень в Gemini завдяки ШІ-моделі nano-banana.


