UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉
Наталя ХандусенкоШІ (ai)
28 октября 2024, 09:57
2024-10-28
Meta запускає NotebookLlama — ШІ-модель із відкритим вихідним кодом, яка перетворює PDF-файли на подкасти
Meta випустила «відкриту» версію популярної функції створення подкастів NotebookLM від Google. Проєкт під назвою NotebookLlama використовує власні моделі Llama від Meta для більшої частини обробки.
Meta випустила «відкриту» версію популярної функції створення подкастів NotebookLM від Google. Проєкт під назвою NotebookLlama використовує власні моделі Llama від Meta для більшої частини обробки.
Спочатку NotebookLlama створює стенограму з файлу — наприклад, PDF-файлу новини або публікації в блозі. Потім додає «більше драматизму» та пауз для більшого реалізму. переривань, перш ніж подати транскрипт у відкриті моделі перетворення тексту в мовлення. Далі текст передається у відкриті моделі синтезу мовлення, щоб отримати звукову версію, пише TechCrunch.
Джерело: TechCrunch
Результати звучать не так добре, як у NotebookLM, кажуть користувачі. Голоси мають дуже очевидну роботизовану якість і тенденцію перекрикувати один одного в незрозумілих місцях.
Але дослідники Meta, які стоять за проєктом, кажуть, що якість можна покращити за допомогою сильніших моделей.
«Модель перетворення тексту в мову є обмеженням того, наскільки природно це звучатиме», — пишуть дослідники Meta на сторінці NotebookLlama на GitHub. «Інший підхід до написання подкасту полягає в тому, що два агенти обговорюють тему, яка їх цікавить, і пишуть план подкасту. Зараз ми використовуємо єдину модель для написання плану подкасту».
«В октябре выпускаем VR-шлем для аватаров, в «чипирование» Neuralink Маска верю мало». О чем глава Meta Цукерберг 3 часа говорил в подкасте Джо Рогана
25 августа вышла очередная серия популярного подкаста The Joe Rogan Experience, гостем которого стал глава компании Meta Марк Цукерберг. Рассказываем о главном из почти 3-часового интервью.