💳 Trustee Plus — твоя персональна картка європейського банку: 3 хвилини і 10 євро 👉
Олександр КузьменкоДеньги
24 октября 2023, 10:02
2023-10-24
Газеты хотят получать плату за использование своих статей в ChatGPT и ведут переговоры с OpenAI
С августа по меньшей мере 535 новостных организаций, включая New York Times, Reuters и The Washington Post, установили блокировщик, запрещающий сбор и использование их контента для обучения ChatGPT. Сейчас несколько крупных газет ведут переговоры с компанией OpenAI, разработчиком ChatGPT, о доступе к своим материалам за деньги.
Обсуждения сосредоточены на оплате издателям, а чат-бот сможет показывать ссылки на отдельные новости в своих ответах. Это принесло бы пользу газетам в двух моментах: предоставление прямой оплаты и потенциальное увеличение трафика на их вебсайтах, пишет The Washington Post.
В июле Open AI заключила соглашение о лицензировании контента Associated Press как обучающих данных для своих ИИ-моделей. По словам двух людей, знакомых с переговорами, нынешние переговоры касаются этой идеи, но больше сосредотачиваются на показе историй в ответах ChatGPT.
Инсайдеры также сообщают, что представители Reddit, крупнейшего в мире форума, встречались с ведущими компаниями-разработчиками искусственного интеллекта, чтобы обсудить вопросы оплаты за их данные. Если сделка не будет достигнута, Reddit рассматривает возможность блокировки поисковых роботов Google и Bing, что не позволит найти форум в поисковиках и уменьшит количество посетителей сайта. Но компания считает, что компромисс стоит того: «Reddit может выжить без поиска».
Поскольку генеративный ИИ готов изменить то, как пользователи взаимодействуют с интернетом, многие издатели и другие компании рассматривают справедливую оплату за свои данные как экзистенциальную проблему.
Например, через месяц после того, как OpenAI запустила GPT-4 в марте, трафик сообщества программистов Stack Overflow снизился на 15 процентов, поскольку программисты обратились к ИИ за ответами на свои вопросы по кодированию, по словам генерального директора Прашанта Чандрасекара, который также сказал The Post он считает, что ИИ был обучен на данных Stack Overflow. Недавно компания уволила 28% своих сотрудников.
Представитель OpenAI подтвердил, что компания ведет переговоры с газетами и что дискуссии не касаются данных предыдущего обучения, которые, как утверждается, были получены законным путем. «Ни одна из практик компании не нарушала закон об авторском праве, — сказал представитель компании. «Любое соглашение предусматривало бы будущий доступ к контенту, который в противном случае был бы недоступен, или использование, которое выходит за рамки добросовестного».
В нынешних условиях лучшие шансы заключить соглашение являются владельцы данных, привыкших отстаивать свои права на интеллектуальную собственность, а не отдельные создатели контента, считает Ясин Джерните, возглавляющая команду по машинному обучению и обществу в Hugging Face, стартапе с открытым исходным кодом ИИ.
К примеру, сайт стоковых фотографий Shutterstock сотрудничает с OpenAI для предоставления учебных данных. В конце прошлого года компания также запустила фонд Contributor Fund для компенсации художникам, работы которых были использованы для обучения ИИ-моделей.