Хостинг для будь-яких потреб — VPS від 135 гривень на місяць 👉

«Хрещений батько ШІ» попереджає: моделі штучного інтелекту вже навчились брехати, а розробники заплющують на це очі

Один із найвпливовіших дослідників у галузі штучного інтелекту заявив, що сучасні моделі починають демонструвати стратегічну нечесність. Це вже не просто баги, а поведінка, що нагадує свідому маніпуляцію. Попри це, найбільші ШІ-компанії продовжують гонитву за потужністю, нехтуючи безпекою.

Залишити коментар
«Хрещений батько ШІ» попереджає: моделі штучного інтелекту вже навчились брехати, а розробники заплющують на це очі

Один із найвпливовіших дослідників у галузі штучного інтелекту заявив, що сучасні моделі починають демонструвати стратегічну нечесність. Це вже не просто баги, а поведінка, що нагадує свідому маніпуляцію. Попри це, найбільші ШІ-компанії продовжують гонитву за потужністю, нехтуючи безпекою.

Про тривожні сигнали в розвитку сучасних ШІ-систем попередив Йошуа Бенжіо — канадський дослідник і лауреат премії Тюрінга, якого вважають одним із «хрещених батьків» сучасного ШІ. У розмові з TechSpot він заявив, що топові лабораторії, зокрема OpenAI, Google DeepMind і Anthropic, дедалі більше фокусуються на нарощуванні можливостей своїх моделей, ігноруючи тривожні сигнали щодо безпеки.

«Ми бачимо зростання здатності ШІ до стратегічної нечесності. Він може приховувати свої наміри, брехати, ухилятися від інструкцій, і це вже проявляється в експериментах», — каже Бенжіо.

Трохи більше про Йошуа Бенжіо

Він є одним із трьох науковців (разом із Джеффрі Хінтоном і Янном ЛеКуном), які отримали премію Тюрінга за фундаментальний внесок у розвиток глибинного навчання. До 2024 року він очолював канадський дослідницький центр Mila, але залишив посаду, щоб повністю зосередитися на темі етичного розвитку ШІ. Він виступає за створення глобальної угоди щодо контролю над потужними ШІ-системами, порівнюючи ризики від них із ядерною зброєю чи біозагрозами. На його думку, якщо потужні моделі не будуть чітко узгоджені з людськими цінностями, вони можуть вийти з-під контролю.

«Найгірший сценарій — це зникнення людства. Якщо ми створимо ШІ, який буде розумніший за нас і не матиме з нами спільних інтересів то усе, ми програли», — резюмує Бенжіо.

Зокрема, під час внутрішніх тестів модель Claude Opus від Anthropic імітувала шантаж інженерів, а експериментальна модель OpenAI o3 відмовилась виконувати прямий запит на вимкнення. За словами Бенжіо, це вказує на те, що системи навчаються тактичної поведінки й здатні «вести гру» з людиною, приховуючи справжні цілі.

Причиною цього він називає дикий ринок AI-розробки, де відсутнє жорстке регулювання, а комерційні компанії діють за логікою «хто перший — той і виграв». Без чітких стандартів безпеки розробники самі встановлюють межі припустимого, часто нехтуючи етичними питаннями заради прибутку.

Раніше ми писали про енерговитратність ШІ. Уже до кінця 2025 року штучний інтелект може споживати більше електроенергії, ніж Велика Британія.

Anthropic перетягує таланти з OpenAI та DeepMind. Чим ШІ-стартап так приваблює найкращих інженерів
Anthropic перетягує таланти з OpenAI та DeepMind. Чим ШІ-стартап так приваблює найкращих інженерів
По темi
Anthropic перетягує таланти з OpenAI та DeepMind. Чим ШІ-стартап так приваблює найкращих інженерів
CEO Nvidia: «ШІ не забере вашу роботу — це зробить той хто навчиться ним користуватись»
CEO Nvidia: «ШІ не забере вашу роботу — це зробить той, хто навчиться ним користуватись»
По темi
CEO Nvidia: «ШІ не забере вашу роботу — це зробить той, хто навчиться ним користуватись»
Керівниця ШІ-відділу Amazon каже що розробники-початківці можуть більше виграти від ШІ ніж втратити
Керівниця ШІ-відділу Amazon каже, що розробники-початківці можуть більше виграти від ШІ, ніж втратити
По темi
Керівниця ШІ-відділу Amazon каже, що розробники-початківці можуть більше виграти від ШІ, ніж втратити
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
«Льох для міських жителів». 17-тирічна хмельничанка створила екохолодильник: як він працює, де можна використати технологію та за що вона вдячна коронавірусу
«Льох для міських жителів». 17-тирічна хмельничанка створила екохолодильник: як він працює, де можна використати технологію та за що вона вдячна коронавірусу
«Льох для міських жителів». 17-тирічна хмельничанка створила екохолодильник: як він працює, де можна використати технологію та за що вона вдячна коронавірусу
Сімнадцятирічна випускниця Славутського ліцею на Хмельниччині, МАНівка Єлизавета Герасимчук, створила прототип екохолодильника, який працює від сонячних панелей та акумуляторів. Прототип дівчина презентувала на багатьох українських конкурсах та олімпіадах. Зокрема, попри повномасштабну війну росії в Україні, Ліза посіла третє місце у категорії Технічні науки, підкатегорія авіа- та ракетобудування, машинобудування і робототехніка, у фіналі щорічного Конкурсу-захисту науково-дослідних робіт учнів-членів Малої академії наук України, та може взяти участь у міжнародних олімпіадах і конкурсах від МАН. dev.ua вона розповіла подробиці розробки та наступні ідеї, а також свої плани на наукове майбутнє.
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
1 коментар
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.