👁️👁️ 300 000 криптанів встановили собі Trustee Plus - гаманець з криптокарткою. Чого чекаєш ти? 👉

OpenAI нишком запустила GPTBot — вебкраулер, який збирає дані сайтів для навчання ШІ. Вебмайстри вже займають оборону

Розробник ChatGPT, компанія OpenAI без зайвого галасу та офіційних анонсів запустила нового бота для сканування контенту вебсайтів, щоб навчити свої великі мовні моделі (LLM). Після того, як про нього стало відомо, власники вебсайтів стали блокувати GPTBot, забороняючи сканування даних на своїх сайтах.

Залишити коментар
OpenAI нишком запустила GPTBot — вебкраулер, який збирає дані сайтів для навчання ШІ. Вебмайстри вже займають оборону

Розробник ChatGPT, компанія OpenAI без зайвого галасу та офіційних анонсів запустила нового бота для сканування контенту вебсайтів, щоб навчити свої великі мовні моделі (LLM). Після того, як про нього стало відомо, власники вебсайтів стали блокувати GPTBot, забороняючи сканування даних на своїх сайтах.

OpenAI сама надає інструкцію, як заборонити GPTBot сканування, якщо цього не хоче власник контенту, пише VentureBeat. Для цього потрібно внести невеликі зміни у файлу robots.txt на сайті. Однак, враховуючи як інтенсивно веб сканується іншими способами, незрозуміло, чи зможе просте блокування GPTBot повністю зупинити потрапляння контенту до даних для навчання великих мовних моделей.

Представник OpenAI підтвердив, що компанія періодично збирає загальнодоступні дані з Інтернету, які можуть бути використані для покращення майбутніх моделей ШІ.

«На нашому вебсайті ми надаємо інструкції про те, як заборонити нашому боту збирати дані. Вебсторінки фільтруються, щоб видалити джерела, які мають пейволи, збирають особисту інформацію (PII) або містять текст, який порушує нашу політику», — наголосили в компанії

Популярний сайт The Verge, вже модифікував свій файл robots.txt, щоб зупинити GPTBot від збору контенту. Кейсі Ньютон (Casey Newton) запитав читачів свого інформаційного бюлетеня Platformer, чи варто йому зупинити OpenAI від збору його контенту. А Ніл Кларк, редактор науково-фантастичного журналу Clarkesworld, заявив у X (Twitter), що він заблокує GPTBot.

Цікаво, що незабаром після того, як стало відомо про запуск GPTBot, OpenAI оголосила про грант у розмірі $395 000 і партнерство з Інститутом журналістики Артура Л. Картера при Нью-Йоркському університеті. Ініціатива має на меті допомогти студентам у розробці відповідальних способів використання штучного інтелекту в новинному бізнесі.

Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
OpenAI: Chatgpt для Android у застосунку вийде наступного тижня
OpenAI: Chatgpt для Android у застосунку вийде наступного тижня
По темi
OpenAI: Chatgpt для Android у застосунку вийде наступного тижня
Open AI анонсувала кілька покращень для ChatGPT. Вони зявляться вже наступного тижня
Open AI анонсувала кілька покращень для ChatGPT. Вони з’являться вже наступного тижня
По темi
Open AI анонсувала кілька покращень для ChatGPT. Вони з’являться вже наступного тижня
Американські вчені перевірили як добре ChatGPT  розуміється на темі програмування. Результати не на користь чатбота
Американські вчені перевірили як добре ChatGPT розуміється на темі програмування. Результати не на користь чатбота
По темi
Американські вчені перевірили як добре ChatGPT розуміється на темі програмування. Результати не на користь чатбота
УЧАСТЬ В АЗАРТНИХ ІГРАХ МОЖЕ ВИКЛИКАТИ ІГРОВУ ЗАЛЕЖНІСТЬ. ДОТРИМУЙТЕСЯ ПРАВИЛ (ПРИНЦИПІВ) ВІДПОВІДАЛЬНОЇ ГРИ.
Ліцензія видана ТОВ "СЛОТС Ю.ЕЙ." на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 15.09.23 (рішення КРАІЛ №245 від 31.08.2023); ТОВ "СЛОТС Ю.ЕЙ." – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 26.04.2021 (рішення КРАІЛ №150 від 12.04.2021); ТОВ «СПЕЙСИКС» – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 08.02.2021 (рішення КРАІЛ №34 від 02.02.2021); ТОВ «ГЕЙМДЕВ» – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 16.02.2021 (рішення № 47 від 10.02.2021).

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.