UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

Meta downloaded over 80 TB of pirated books from torrents to train artificial intelligence models

The writers' lawsuit against Meta has revealed new details about the use of pirated copies of books, including from the Russian library LibGen, to train the company’s artificial intelligence models.

Leave a comment
Meta downloaded over 80 TB of pirated books from torrents to train artificial intelligence models

The writers' lawsuit against Meta has revealed new details about the use of pirated copies of books, including from the Russian library LibGen, to train the company’s artificial intelligence models.

Last month, Meta admitted that it used torrents to download a large dataset known as LibGen, which contains tens of millions of pirated books, Ars Technica reports .

Now, for the first time, unredacted Meta emails have been released, indicating that the company downloaded «at least 81.7 terabytes of data from multiple shadow libraries via the Anna’s Archive website, including at least 35.7 terabytes of data from Z-Library and LibGen,» the authors’ lawsuit states. It also states that «Meta also previously downloaded 80.6 terabytes of data from LibGen.»

«The scale of Meta’s illegal torrenting scheme is staggering,» the writers note. They argue that «much smaller acts of data piracy—just 0.008 percent of the number of copyrighted works copied by Meta—led to judges referring the case to the U.S. Attorney’s Office for a criminal investigation.»

The company had previously sought to block publicity about using pirated books to train its AI models. However, the judge rejected Meta’s request, saying the company insisted on redacting the materials not to protect its business interests but to «avoid negative publicity.»

Meta revealed in a research paper that it trained its large Llama language model on snippets from Books3, a dataset of about 196,000 books scraped from the internet. However, it had not previously publicly indicated that it was loading the data directly from LibGen.

Read the country's main IT news in our Telegram
Read the country’s main IT news in our Telegram
On the topic
Read the country’s main IT news in our Telegram
Meta plans to increase its investments in VR to $100 billion by 2025. The focus will be on "smart" glasses
Meta plans to increase its investments in VR to $100 billion by 2025. The focus will be on «smart» glasses
On the topic
Meta plans to increase its investments in VR to $100 billion by 2025. The focus will be on «smart» glasses
A vulnerability has been discovered in Meta's Llama framework that exposes AI systems to risks of remote code execution
A vulnerability has been discovered in Meta’s Llama framework that exposes AI systems to risks of remote code execution
On the topic
A vulnerability has been discovered in Meta’s Llama framework that exposes AI systems to risks of remote code execution
Meta AI chatbot gets confused with US presidents: what's the matter?
Meta AI chatbot gets confused with US presidents: what’s the matter?
On the topic
Meta AI chatbot gets confused with US presidents: what’s the matter?
Also Read
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Жодних ігор у метавсесвіті: Facebook припинить підтримку свого сервісу для геймерів
Жодних ігор у метавсесвіті: Facebook припинить підтримку свого сервісу для геймерів
Жодних ігор у метавсесвіті: Facebook припинить підтримку свого сервісу для геймерів
«В жовтні випускаємо VR-шолом для аватарів, в «чіпування» Neuralink Маска вірю мало». Про що глава Meta Цукерберг 3 години говорив в подкасті Джо Рогана
«В жовтні випускаємо VR-шолом для аватарів, в «чіпування» Neuralink Маска вірю мало». Про що глава Meta Цукерберг 3 години говорив в подкасті Джо Рогана
«В жовтні випускаємо VR-шолом для аватарів, в «чіпування» Neuralink Маска вірю мало». Про що глава Meta Цукерберг 3 години говорив в подкасті Джо Рогана
25 серпня вийшла чергова серія популярного подкасту The Joe Rogan Experience, гостем якого став глава компанії Meta Марк Цукерберг. Розповідаємо про головне з майже 3-годинного інтерв’ю.
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Нейронні мережі для генерації зображень бачать світ по-своєму, їхню логіку зрозуміти часом зовсім неможливо. Але таки хочеться. На честь Дня Незалежності України редакція dev.ua вирішила провести невеликий експеримент. Ми задали чотирьом різним нейронним мережам п’ять однакових запитів: «прапор України», «День Незалежності України», «український Крим», «перемога України» та «українці». Отриманими результатами ми ділимося з вами нижче.

Have important news to share? Message our Telegram bot

Key events and useful links in our Telegram channel

Discussion
No comments yet.