UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉
Олександр КузьменкоHot News
7 February 2025, 16:15
2025-02-07
Meta downloaded over 80 TB of pirated books from torrents to train artificial intelligence models
The writers' lawsuit against Meta has revealed new details about the use of pirated copies of books, including from the Russian library LibGen, to train the company’s artificial intelligence models.
The writers' lawsuit against Meta has revealed new details about the use of pirated copies of books, including from the Russian library LibGen, to train the company’s artificial intelligence models.
Last month, Meta admitted that it used torrents to download a large dataset known as LibGen, which contains tens of millions of pirated books, Ars Technica reports .
Now, for the first time, unredacted Meta emails have been released, indicating that the company downloaded «at least 81.7 terabytes of data from multiple shadow libraries via the Anna’s Archive website, including at least 35.7 terabytes of data from Z-Library and LibGen,» the authors’ lawsuit states. It also states that «Meta also previously downloaded 80.6 terabytes of data from LibGen.»
«The scale of Meta’s illegal torrenting scheme is staggering,» the writers note. They argue that «much smaller acts of data piracy—just 0.008 percent of the number of copyrighted works copied by Meta—led to judges referring the case to the U.S. Attorney’s Office for a criminal investigation.»
Meta revealed in a research paper that it trained its large Llama language model on snippets from Books3, a dataset of about 196,000 books scraped from the internet. However, it had not previously publicly indicated that it was loading the data directly from LibGen.
«В жовтні випускаємо VR-шолом для аватарів, в «чіпування» Neuralink Маска вірю мало». Про що глава Meta Цукерберг 3 години говорив в подкасті Джо Рогана
25 серпня вийшла чергова серія популярного подкасту The Joe Rogan Experience, гостем якого став глава компанії Meta Марк Цукерберг. Розповідаємо про головне з майже 3-годинного інтерв’ю.
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Нейронні мережі для генерації зображень бачать світ по-своєму, їхню логіку зрозуміти часом зовсім неможливо. Але таки хочеться. На честь Дня Незалежності України редакція dev.ua вирішила провести невеликий експеримент.
Ми задали чотирьом різним нейронним мережам п’ять однакових запитів: «прапор України», «День Незалежності України», «український Крим», «перемога України» та «українці». Отриманими результатами ми ділимося з вами нижче.
Have important news to share? Message our Telegram bot
Key events and useful links in our Telegram channel