Марія Бровінська Такая жизнь 1 мая 2023, 14:38

Привет, будущее. Исследователи обнаружили 49 сайтов, новости для которых придумывает ИИ. Как работают контент-фермы и что говорят в OpenAI и Google

Рейтинговая группа новостей NewsGuard обнаружила, что в интернете распространяются десятки новостных вебсайтов, созданных чат-ботами с искусственным интеллектом, пишет Bloomberg.

Оставить комментарий

Привет, будущее. Исследователи обнаружили 49 сайтов, новости для которых придумывает ИИ. Как работают контент-фермы и что говорят в OpenAI и Google

Рейтинговая группа новостей NewsGuard обнаружила, что в интернете распространяются десятки новостных вебсайтов, созданных чат-ботами с искусственным интеллектом, пишет Bloomberg.

В новом отчете задокументировано 49 новых вебсайтов, заполненных инструментами ИИ, такими как ChatGPT, которые выдают себя за новостные агентства.

Некоторые выглядят как сайты экстренных новостей с такими общими названиями, как News Live 79 и Daily Business Post, в то время как другие делятся советами по образу жизни, новостями о знаменитостях или публикуют спонсируемое содержимое. Но никто не разглашает, что они заполняются с помощью чат-ботов AI, таких, как ChatGPT от OpenAI Inc. и, возможно, Google Bard от Alphabet Inc., которые могут генерировать подробный текст на основе простых пользовательских подсказок. Многие веб-сайты начали публиковаться в этом году, поскольку инструменты ИИ стали широко использоваться общественностью.

В нескольких случаях NewsGuard задокументировал, как чат-боты генерировали ложь для опубликованных материалов. Только в апреле веб-сайт под названием CelebritiesDeaths.com опубликовал статью под названием «Байден умер. Гаррис, исполняющий обязанности президента, обращение в 9 утра».

А сайт TNewsNetwork опубликовал непроверенную историю о гибели тысяч солдат в российско-украинской войне на основе видео с YouTube.

Большинство сайтов, похоже, являются контент-фермами — низкокачественными веб-сайтами, управляемыми анонимными источниками, создающими сообщения для рекламы. Новости на этих ресурсах публикуются на нескольких языках, включая английский, португальский, тагальский и тайский, сообщает NewsGuard в своем отчете.

Несколько сайтов получили определенную прибыль, рекламируя «гостевые публикации», с помощью которых люди могут заказывать упоминания о своем бизнесе на веб-сайтах за определенную плату, чтобы улучшить рейтинг в результатах поиска. Другие, похоже, пытались создать аудиторию в социальных сетях, таких как ScoopEarth.com, публикующий биографии знаменитостей и чья соответствующая страница в Facebook имеет 124 000 подписчиков.

Как искали контент-фермы

Чтобы найти эти сайты, исследователи NewsGuard использовали поиск по ключевым словам по фразам, обычно создаваемым чат-ботами ИИ, например «как большая языковая модель ИИ» и «мой конечный срок в сентябре 2021 года». Исследователи провели поиск с помощью таких инструментов, как принадлежащая Facebook платформа анализа социальных сетей CrowdTangle и платформа мониторинга медиа Meltwater. Они также оценивали статьи с помощью классификатора текста AI GPTZero, который определяет, вероятно, что некоторые фрагменты написаны полностью AI.

Каждый из сайтов, проанализированных NewsGuard, опубликовал по крайней мере одну статью с сообщением об ошибке, обычно встречающимся в тексте, сгенерированном искусственным интеллектом, и несколько представленных поддельных профилей авторов.

Одно издание, CountyLocalNews.com, освещающее преступления и текущие события, опубликовало статью в марте, используя данные чат-бота искусственного интеллекта, который, казалось, побуждал написать о фальшивом сговоре о массовой смерти людей из-за вакцин. «Новости смерти», — говорилось в нем. «К сожалению, я не могу выполнить этот заказ, поскольку это противоречит этическим и нравственным принципам. Вакцинальный геноцид — это теория заговора, которая не основывается на научных доказательствах и может нанести вред здоровью населения».

Другие веб-сайты использовали чат-боты искусственного интеллекта для ремиксов опубликованных историй из других источников, едва избегая плагиата, добавляя ссылку на источник внизу частей. А издание под названием Biz Breaking News использовало инструменты для обобщения статей из Financial Times и Fortune, добавляя каждую статью к «трем ключевым моментам», сгенерированным с помощью инструментов ИИ.

Монетизация контент-ферм

Более половины сайтов зарабатывают на программируемой рекламе, где место для рекламы на сайтах покупается и продается автоматически с помощью алгоритмов.

Хотя многие сайты, казалось, не привлекали посетителей, и лишь некоторые из них видели значительное участие в социальных сетях, были и другие признаки того, что они способны приносить определенные доходы. Ресурсы, идентифицированные NewsGuard, использовали программные рекламные услуги таких компаний, как MGID и Criteo, чтобы получить доход, согласно обзору Bloomberg исследования группы. MGID и Criteo не сразу ответили на запросы о комментариях.

Два десятка сайтов были монетизированны с помощью рекламной технологии Google, в политике которой указано, что компания запрещает показ рекламы Google на страницах с «малоценным содержимым» и на страницах с «тиражированным содержимым», независимо от того, как он был сгенерирован. (Google удалил рекламу с некоторых веб-сайтов только после того, как Bloomberg связался с компанией.)

Гиансиракуза, профессор Bentley, сказал, что вызывает беспокойство то, насколько дешевой стала эта схема, без человеческого ущерба для виновных в мошенничестве. «Раньше это была низкооплачиваемая схема. Но, по крайней мере, это было не бесплатно», — сказал он. «Сейчас можно купить лотерейный билет для этой игры».

Что говорят разработчики ИИ-ботов

Сопредседатель исполнительного директора NewsGuard Гордон Кровиц сказал, что отчет группы показывает, что такие компании, как OpenAI и Google, должны позаботиться о том, чтобы научить свои модели не придумывать новости. «Использование моделей искусственного интеллекта, известных тем, что придумывают факты, чтобы создавать то, что только выглядит как новостные веб-сайты, является мошенничеством, которое маскируется под журналистику», — сказал Кровиц, бывший издатель Wall Street Journal.

OpenAI не сразу ответила на запрос о комментариях, но ранее заявляла, что использует сочетание рецензентов и автоматизированных систем для обнаружения и предотвращения злоупотреблений своей моделью, включая выдачу предупреждений или в серьезных случаях запрет пользователей.

В ответ на вопрос Bloomberg о том, созданы ли искусственным интеллектом веб-сайты нарушали их рекламную политику, представитель Google Майкл Акиман сказал, что компания не позволяет показывать рекламу вместе с вредоносным или спам-контентом или контентом, скопированным с других сайтов.

«Применяя эту политику, мы сосредотачиваемся на качестве содержания, а не на том, как оно было создано, и мы блокируем или прекращаем показ рекламы, если выявляем нарушение», — сказал Асиман в заявлении.

Google добавляет, что после обращения Bloomberg компания удалила рекламу с некоторых страниц сайтов, а в случаях, когда компания обнаружила повсеместные нарушения, она полностью удалила рекламу с веб-сайтов.

В Google отмечают, что наличие контента, созданного искусственным интеллектом, по сути своей не является нарушением ее рекламной политики, но она оценивает контент в соответствии с существующей политикой издателей. Кроме того, было сказано, что использование автоматизации, включая искусственный интеллект, для создания контента с целью манипулирования рейтингом в результатах поиска нарушает политику компании по спаму. Компания регулярно отслеживает тенденции злоупотреблений в своей рекламной экосистеме и, соответственно, корректирует свою политику и системы принуждения.