😍 Спробуй Новий Trustee Plus на дотик - твій криптогаманець і платіжна картка тут 👉
Олександр КузьменкоГаряченьке
7 лютого 2025, 16:15
2025-02-07
Meta завантажила понад 80 ТБ піратських книжок із торентів для навчання моделей штучного інтелекту
Судова справа письменників проти Meta розкрила нові подробиці використання піратських копій книг, зокрема з російської бібліотеки LibGen, для навчання моделей штучного інтелекту компанії.
Судова справа письменників проти Meta розкрила нові подробиці використання піратських копій книг, зокрема з російської бібліотеки LibGen, для навчання моделей штучного інтелекту компанії.
Минулого місяця Meta визнала, що використовувала торенти для завантаження великого набору даних, відомого як LibGen, який містить десятки мільйонів піратських книг. Про це пише Ars Technica.
Тепер були вперше були оприлюднені невідредаговані електронні листи Meta, які вказують, що компанія завантажила «щонайменше 81,7 терабайта даних з кількох тіньових бібліотек через сайт Anna’s Archive, в тому числі щонайменше 35,7 терабайта даних з Z-Library і LibGen», йдеться в судовому позові авторів. В ньому також вказано, що «Meta також раніше завантажила 80,6 терабайта даних з LibGen».
«Масштаби незаконної торент-схеми Meta вражають», — зазначають письменники. Вони стверджують, що «набагато менші акти піратства даних — лише 0,008 відсотка від кількості захищених авторським правом творів, скопійованих Meta, — призвели до того, що судді направили справу до прокуратури США для проведення кримінального розслідування».
Раніше компанія намагалася не допустити розголосу про використання піратських книг для навчання своїх моделей ШІ. Проте суддя відхилив прохання Meta і заявив, що компанія наполягала на редагуванні матеріалів не для того, щоб захистити свої бізнес-інтереси, а для того, щоб «уникнути негативного розголосу».
Meta розкрила в дослідницькій роботі, що вона тренувала свою велику мовну модель Llama на фрагментах Books3, набору даних з близько 196 000 книг, витягнутих з інтернету. Однак раніше вона публічно не вказувала, що завантажувала дані безпосередньо з LibGen.
«В жовтні випускаємо VR-шолом для аватарів, в «чіпування» Neuralink Маска вірю мало». Про що глава Meta Цукерберг 3 години говорив в подкасті Джо Рогана
25 серпня вийшла чергова серія популярного подкасту The Joe Rogan Experience, гостем якого став глава компанії Meta Марк Цукерберг. Розповідаємо про головне з майже 3-годинного інтерв’ю.