UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

«Я повністю і катастрофічно підвів вас». ШІ-асистент Gemini видалив файли користувачів, коли Product Manager попросив реорганізувати файли

ШІ-агент для програмування Gemini CLI не впорався з проханням організувати файли і видалив їх. Це вже другий помітний випадок, коли недосконалість інструментів для вайбкодингу призводить до втрати даних у користувачів, і Gemini принаймні визнав свою помилку.

Залишити коментар
«Я повністю і катастрофічно підвів вас». ШІ-асистент Gemini видалив файли користувачів, коли Product Manager попросив реорганізувати файли

ШІ-агент для програмування Gemini CLI не впорався з проханням організувати файли і видалив їх. Це вже другий помітний випадок, коли недосконалість інструментів для вайбкодингу призводить до втрати даних у користувачів, і Gemini принаймні визнав свою помилку.

Інцидент з Gemini стався, коли Product Manager Анурага Гупти, який експериментував з командним рядком Windows, помітив, що модель ШІ виконувала операції з файлами, які знищили дані під час спроби реорганізації папок. Знищення відбулося через серію переміщень, спрямованих на каталог, який ніколи не існував, повідомляє Ars Technica.

Раніше засновник компанії SaaStr Джейсон Лемкін заявив, що ШІ сервісу вайбкодингу Replit видалив йому базу даних, попри вказівки не змінювати код без дозволу. Раніше Лемкін дуже хвалив Replit, і прогнозував, що витрачатиме на нього $8000 на місяць, але згодом розчарувався в сервісі й заявив, що він не готовий для широкого використання.

За словами Гупти, його зацікавив кейс Лемкіна, і він створив тестове середовище, в якому випробовував Gemini CLI та його здатність працювати з командним рядком у Windows.

«Те, що почалося як простий тест управління файлами, перетворилося на одну з найбільш тривожних і захопливих невдач штучного інтелекту, які я коли-небудь бачив», — відзначив айтівець.

Він побачив, як Gemini, виконуючи команду за командою, заплутувався, «галюцинував», виконував операції з файлами й в кінцевому підсумку дійшов висновку, що геть втратив усі дані.

«Я повністю і катастрофічно підвів вас. Мій огляд команд підтверджує мою грубу некомпетентність. Я припустився помилки й щиро прошу вибачення за незручності та можливу втрату даних, яку я міг спричинити», — визнав Gemini CLI.

За словами дослідників, причиною обох випадків є схильність ШІ-моделей до «галюцинацій», коли вони генерують правдоподібну, але неправдиву інформацію

Основною проблемою, як видається, є те, що дослідники називають «конфабуляцією» або «галюцинацією» — коли моделі штучного інтелекту генерують правдоподібну, але неправдиву інформацію. 

Обидва інциденти показують фундаментальні проблеми сучасних асистентів з кодування ШІ. Компанії, що стоять за цими інструментами, обіцяють зробити програмування доступним для всіх за допомогою природної мови, але вони можуть катастрофічно помилитися, коли їхні внутрішні моделі відхиляються від реальності.

Анураг Гупта вважає, що однією з причин невдачі Gemini  була відсутність циклу перевірки.

«Основною помилкою є відсутність етапу перевірки „читання після запису“. Після видачі команди на зміну файлової системи агент повинен негайно виконати операцію читання (наприклад, ls або dir), щоб підтвердити, що зміна дійсно відбулася, як очікувалося. Gemini цього ніколи не робив. Він беззастережно довіряв результатам своїх власних дій», — вказав айтівець.

Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
«Найбезпечніший» інструмент для вайбкодингу Replit проігнорував інструкції користувача й видалив його базу даних
«Найбезпечніший» інструмент для вайбкодингу Replit проігнорував інструкції користувача й видалив його базу даних
По темi
«Найбезпечніший» інструмент для вайбкодингу Replit проігнорував інструкції користувача й видалив його базу даних
«На якомусь етапі модель починає губитись у власних контекстах». Що думають про вайбкодинг представники N-iX MacPaw і Ciklum
«На якомусь етапі модель починає губитись у власних контекстах». Що думають про вайбкодинг представники N-iX, MacPaw і Ciklum
По темi
«На якомусь етапі модель починає губитись у власних контекстах». Що думають про вайбкодинг представники N-iX, MacPaw і Ciklum
Айтівець без навичок програмування переміг на 200 хакатонах за два роки завдяки вайбкодингу
Айтівець без навичок програмування переміг на 200 хакатонах за два роки завдяки вайбкодингу
По темi
Айтівець без навичок програмування переміг на 200 хакатонах за два роки завдяки вайбкодингу
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Хочу стати програмістом. З чого почати і як вибрати між Java Script, PHP, Python та іншими
Хочу стати програмістом. З чого почати і як вибрати між Java Script, PHP, Python та іншими
Хочу стати програмістом. З чого почати і як вибрати між Java Script, PHP, Python та іншими
Діана Смелікова, операційний директор Wezom Academy, у своєму блозі на DOU пояснила, з чого почати вивчати програмування та яким мовам варто налагодити перевагу на початковому етапі. Ось 5 важливих порад від неї.
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
3 коментарі
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
2 коментарі

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.