UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉
Наталя ХандусенкоШІ
28 жовтня 2024, 09:57
2024-10-28
Meta запускає NotebookLlama — ШІ-модель із відкритим вихідним кодом, яка перетворює PDF-файли на подкасти
Meta випустила «відкриту» версію популярної функції створення подкастів NotebookLM від Google. Проєкт під назвою NotebookLlama використовує власні моделі Llama від Meta для більшої частини обробки.
Meta випустила «відкриту» версію популярної функції створення подкастів NotebookLM від Google. Проєкт під назвою NotebookLlama використовує власні моделі Llama від Meta для більшої частини обробки.
Спочатку NotebookLlama створює стенограму з файлу — наприклад, PDF-файлу новини або публікації в блозі. Потім додає «більше драматизму» та пауз для більшого реалізму. переривань, перш ніж подати транскрипт у відкриті моделі перетворення тексту в мовлення. Далі текст передається у відкриті моделі синтезу мовлення, щоб отримати звукову версію, пише TechCrunch.
Джерело: TechCrunch
Результати звучать не так добре, як у NotebookLM, кажуть користувачі. Голоси мають дуже очевидну роботизовану якість і тенденцію перекрикувати один одного в незрозумілих місцях.
Але дослідники Meta, які стоять за проєктом, кажуть, що якість можна покращити за допомогою сильніших моделей.
«Модель перетворення тексту в мову є обмеженням того, наскільки природно це звучатиме», — пишуть дослідники Meta на сторінці NotebookLlama на GitHub. «Інший підхід до написання подкасту полягає в тому, що два агенти обговорюють тему, яка їх цікавить, і пишуть план подкасту. Зараз ми використовуємо єдину модель для написання плану подкасту».
«В жовтні випускаємо VR-шолом для аватарів, в «чіпування» Neuralink Маска вірю мало». Про що глава Meta Цукерберг 3 години говорив в подкасті Джо Рогана
25 серпня вийшла чергова серія популярного подкасту The Joe Rogan Experience, гостем якого став глава компанії Meta Марк Цукерберг. Розповідаємо про головне з майже 3-годинного інтерв’ю.