💳 Trustee Plus — твоя персональна картка європейського банку: 3 хвилини і 10 євро 👉
Марія БровінськаТакая жизнь
1 мая 2023, 14:38
2023-05-01
Привет, будущее. Исследователи обнаружили 49 сайтов, новости для которых придумывает ИИ. Как работают контент-фермы и что говорят в OpenAI и Google
Рейтинговая группа новостей NewsGuard обнаружила, что в интернете распространяются десятки новостных вебсайтов, созданных чат-ботами с искусственным интеллектом, пишет Bloomberg.
В новом отчете задокументировано 49 новых вебсайтов, заполненных инструментами ИИ, такими как ChatGPT, которые выдают себя за новостные агентства.
Некоторые выглядят как сайты экстренных новостей с такими общими названиями, как News Live 79 и Daily Business Post, в то время как другие делятся советами по образу жизни, новостями о знаменитостях или публикуют спонсируемое содержимое. Но никто не разглашает, что они заполняются с помощью чат-ботов AI, таких, как ChatGPT от OpenAI Inc. и, возможно, Google Bard от Alphabet Inc., которые могут генерировать подробный текст на основе простых пользовательских подсказок. Многие веб-сайты начали публиковаться в этом году, поскольку инструменты ИИ стали широко использоваться общественностью.
В нескольких случаях NewsGuard задокументировал, как чат-боты генерировали ложь для опубликованных материалов. Только в апреле веб-сайт под названием CelebritiesDeaths.com опубликовал статью под названием «Байден умер. Гаррис, исполняющий обязанности президента, обращение в 9 утра».
А сайт TNewsNetwork опубликовал непроверенную историю о гибели тысяч солдат в российско-украинской войне на основе видео с YouTube.
Несколько сайтов получили определенную прибыль, рекламируя «гостевые публикации», с помощью которых люди могут заказывать упоминания о своем бизнесе на веб-сайтах за определенную плату, чтобы улучшить рейтинг в результатах поиска. Другие, похоже, пытались создать аудиторию в социальных сетях, таких как ScoopEarth.com, публикующий биографии знаменитостей и чья соответствующая страница в Facebook имеет 124 000 подписчиков.
Как искали контент-фермы
Чтобы найти эти сайты, исследователи NewsGuard использовали поиск по ключевым словам по фразам, обычно создаваемым чат-ботами ИИ, например «как большая языковая модель ИИ» и «мой конечный срок в сентябре 2021 года». Исследователи провели поиск с помощью таких инструментов, как принадлежащая Facebook платформа анализа социальных сетей CrowdTangle и платформа мониторинга медиа Meltwater. Они также оценивали статьи с помощью классификатора текста AI GPTZero, который определяет, вероятно, что некоторые фрагменты написаны полностью AI.
Каждый из сайтов, проанализированных NewsGuard, опубликовал по крайней мере одну статью с сообщением об ошибке, обычно встречающимся в тексте, сгенерированном искусственным интеллектом, и несколько представленных поддельных профилей авторов.
Одно издание, CountyLocalNews.com, освещающее преступления и текущие события, опубликовало статью в марте, используя данные чат-бота искусственного интеллекта, который, казалось, побуждал написать о фальшивом сговоре о массовой смерти людей из-за вакцин. «Новости смерти», — говорилось в нем. «К сожалению, я не могу выполнить этот заказ, поскольку это противоречит этическим и нравственным принципам. Вакцинальный геноцид — это теория заговора, которая не основывается на научных доказательствах и может нанести вред здоровью населения».
Другие веб-сайты использовали чат-боты искусственного интеллекта для ремиксов опубликованных историй из других источников, едва избегая плагиата, добавляя ссылку на источник внизу частей. А издание под названием Biz Breaking News использовало инструменты для обобщения статей из Financial Times и Fortune, добавляя каждую статью к «трем ключевым моментам», сгенерированным с помощью инструментов ИИ.
Монетизация контент-ферм
Более половины сайтов зарабатывают на программируемой рекламе, где место для рекламы на сайтах покупается и продается автоматически с помощью алгоритмов.
Хотя многие сайты, казалось, не привлекали посетителей, и лишь некоторые из них видели значительное участие в социальных сетях, были и другие признаки того, что они способны приносить определенные доходы. Ресурсы, идентифицированные NewsGuard, использовали программные рекламные услуги таких компаний, как MGID и Criteo, чтобы получить доход, согласно обзору Bloomberg исследования группы. MGID и Criteo не сразу ответили на запросы о комментариях.
Два десятка сайтов были монетизированны с помощью рекламной технологии Google, в политике которой указано, что компания запрещает показ рекламы Google на страницах с «малоценным содержимым» и на страницах с «тиражированным содержимым», независимо от того, как он был сгенерирован. (Google удалил рекламу с некоторых веб-сайтов только после того, как Bloomberg связался с компанией.)
Гиансиракуза, профессор Bentley, сказал, что вызывает беспокойство то, насколько дешевой стала эта схема, без человеческого ущерба для виновных в мошенничестве. «Раньше это была низкооплачиваемая схема. Но, по крайней мере, это было не бесплатно», — сказал он. «Сейчас можно купить лотерейный билет для этой игры».
Что говорят разработчики ИИ-ботов
Сопредседатель исполнительного директора NewsGuard Гордон Кровиц сказал, что отчет группы показывает, что такие компании, как OpenAI и Google, должны позаботиться о том, чтобы научить свои модели не придумывать новости. «Использование моделей искусственного интеллекта, известных тем, что придумывают факты, чтобы создавать то, что только выглядит как новостные веб-сайты, является мошенничеством, которое маскируется под журналистику», — сказал Кровиц, бывший издатель Wall Street Journal.
OpenAI не сразу ответила на запрос о комментариях, но ранее заявляла, что использует сочетание рецензентов и автоматизированных систем для обнаружения и предотвращения злоупотреблений своей моделью, включая выдачу предупреждений или в серьезных случаях запрет пользователей.
В ответ на вопрос Bloomberg о том, созданы ли искусственным интеллектом веб-сайты нарушали их рекламную политику, представитель Google Майкл Акиман сказал, что компания не позволяет показывать рекламу вместе с вредоносным или спам-контентом или контентом, скопированным с других сайтов.
Google добавляет, что после обращения Bloomberg компания удалила рекламу с некоторых страниц сайтов, а в случаях, когда компания обнаружила повсеместные нарушения, она полностью удалила рекламу с веб-сайтов.
В Google отмечают, что наличие контента, созданного искусственным интеллектом, по сути своей не является нарушением ее рекламной политики, но она оценивает контент в соответствии с существующей политикой издателей. Кроме того, было сказано, что использование автоматизации, включая искусственный интеллект, для создания контента с целью манипулирования рейтингом в результатах поиска нарушает политику компании по спаму. Компания регулярно отслеживает тенденции злоупотреблений в своей рекламной экосистеме и, соответственно, корректирует свою политику и системы принуждения.