Наталія АнікушинаГоряченькое
30 апреля 2023, 13:54
2023-04-30
Аналитики проверили 10 млн сайтов, предоставляющих данные чат-бота ChatGPT. Там нашли сайт russia Today
В The Washington Post появилась публикация, где упоминается пропагандистский Russia Today. Что известно о его роли в обучении искусственному интеллекту.
В The Washington Post появилась публикация, где упоминается пропагандистский Russia Today. Что известно о его роли в обучении искусственному интеллекту.
В издании проанализировали один из наборов данных, чтобы полностью выявить типы личных и часто обидных веб-сайтов, входящих в обучающие данные ИИ.
Аналитики изучили рейтинг 10 миллионов лучших веб-сайтов, включенных в Google C4, и обнаружили, что там расистские и очень токсичны с контентом различных форм ненависти.
В процессе исследования было замечено несколько СМИ, занимающих низкие позиции по независимой шкале надежности, среди них был российский пропагандистский russia Today.
Маркетолог Екатерина Панова обратила внимание, что в то время как издание «Украинская правда» имеет показатель использования при обучении ИИ в 6 000 токенов, то показатель пропагандистского russia Today составляет 26 млн токенов.
OpenAI не раскрывает какие наборы данных он использует для обучения моделей своего популярного чат-бота ChatGPT.
Ненадежные обучающие данные могут привести к распространению предвзятости, пропаганды и дезинформации без возможности пользователя отследить их к первоисточнику.