Наталія Анікушина Горяченькое 30 апреля 2023, 13:54

Аналитики проверили 10 млн сайтов, предоставляющих данные чат-бота ChatGPT. Там нашли сайт russia Today

В The Washington Post появилась публикация, где упоминается пропагандистский Russia Today. Что известно о его роли в обучении искусственному интеллекту.

Оставить комментарий

Аналитики проверили 10 млн сайтов, предоставляющих данные чат-бота ChatGPT. Там нашли сайт russia Today

В The Washington Post появилась публикация, где упоминается пропагандистский Russia Today. Что известно о его роли в обучении искусственному интеллекту.

В издании проанализировали один из наборов данных, чтобы полностью выявить типы личных и часто обидных веб-сайтов, входящих в обучающие данные ИИ.

Аналитики изучили рейтинг 10 миллионов лучших веб-сайтов, включенных в Google C4, и обнаружили, что там расистские и очень токсичны с контентом различных форм ненависти.

В процессе исследования было замечено несколько СМИ, занимающих низкие позиции по независимой шкале надежности, среди них был российский пропагандистский russia Today.

Маркетолог Екатерина Панова обратила внимание, что в то время как издание «Украинская правда» имеет показатель использования при обучении ИИ в 6 000 токенов, то показатель пропагандистского russia Today составляет 26 млн токенов.

OpenAI не раскрывает какие наборы данных он использует для обучения моделей своего популярного чат-бота ChatGPT.

Ненадежные обучающие данные могут привести к распространению предвзятости, пропаганды и дезинформации без возможности пользователя отследить их к первоисточнику.