Реклама партнера — Название партнёра
UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

OpenAI додала інструменти з відкритим вихідним кодом, щоб допомогти розробникам створювати безпечні продукти для підлітків

OpenAI повідомила, що випускає набір промптів, які допоможуть розробникам зробити їхні додатки безпечнішими для підлітків. Лабораторія ШІ зазначила, що цей набір правил безпеки можна використовувати разом із її моделлю з відкритими вагами, відомою як gpt-oss-safeguard.

Залишити коментар
OpenAI додала інструменти з відкритим вихідним кодом, щоб допомогти розробникам створювати безпечні продукти для підлітків

OpenAI повідомила, що випускає набір промптів, які допоможуть розробникам зробити їхні додатки безпечнішими для підлітків. Лабораторія ШІ зазначила, що цей набір правил безпеки можна використовувати разом із її моделлю з відкритими вагами, відомою як gpt-oss-safeguard.

Замість того, щоб з нуля вигадувати, як зробити ШІ безпечнішим для підлітків, розробники можуть використовувати ці промпти для захисту своїх продуктів. Вони охоплюють такі проблеми, як графічне насильство та сексуальний контент, шкідливі ідеали краси та моделі поведінки, небезпечні заняття та челенджі, романтичні чи насильницькі рольові ігри, а також товари та послуги з віковими обмеженнями, пише TechCrunch.

Ці політики безпеки розроблені у форматі промптів, що робить їх легко сумісними з іншими моделями, окрім gpt-oss-safeguard, хоча вони, ймовірно, найефективніші саме в екосистемі OpenAI.

Для написання цих промптів OpenAI співпрацювала з організаціями з безпеки ШІ Common Sense Media та everyone.ai.

«Ці політики на основі промптів допомагають встановити вагомий базовий рівень безпеки в усій екосистемі, а оскільки вони випущені як відкритий код, їх можна адаптувати та вдосконалювати з часом», — зазначив у своїй заяві Роббі Торні, керівник відділу ШІ та цифрових оцінок у Common Sense Media.

У своєму блозі OpenAI зауважила, що розробникам, зокрема й досвідченим командам, часто буває складно перетворити загальні цілі безпеки на чіткі операційні правила.

В OpenAI визнають, що ці політики не є остаточним розв’язанням складних викликів у сфері безпеки ШІ. Проте вони ґрунтуються на попередніх напрацюваннях компанії, зокрема на таких інструментах захисту на рівні продуктів, як батьківський контроль та прогнозування віку. Торік OpenAI оновила настанови для своїх великих мовних моделей (відомі як Model Spec), щоб визначити, як саме ШІ має взаємодіяти з користувачами віком до 18 років.

Попри небездоганну репутацію у сфері безпеки ШІ, ці кроки є позитивним зрушенням, зокрема для незалежних розробників. 

«Ти не вигадуєш. Це реально». Студент зі США подав позов на OpenAI і заявив що ChatGPT підштовхнув його до психозу
«Ти не вигадуєш. Це реально». Студент зі США подав позов на OpenAI і заявив, що ChatGPT підштовхнув його до психозу
По темi
«Ти не вигадуєш. Це реально». Студент зі США подав позов на OpenAI і заявив, що ChatGPT підштовхнув його до психозу
OpenAI звільнила одну зі своїх топменеджерок на тлі суперечки про «режим для дорослих» у ChatGPT
OpenAI звільнила одну зі своїх топменеджерок на тлі суперечки про «режим для дорослих» у ChatGPT
По темi
OpenAI звільнила одну зі своїх топменеджерок на тлі суперечки про «режим для дорослих» у ChatGPT
OpenAI відмовляється віддати повну історію чатів ChatGPT після самогубства користувача
OpenAI відмовляється віддати повну історію чатів ChatGPT після самогубства користувача
По темi
OpenAI відмовляється віддати повну історію чатів ChatGPT після самогубства користувача
OpenAI напряму працюватиме з канадськими правоохоронцями після масової стрілянини в школі вчиненої трансгендеркою. Чому прийняте таке рішення і до чого тут ChatGPT
OpenAI напряму працюватиме з канадськими правоохоронцями після масової стрілянини в школі, вчиненої трансгендеркою. Чому прийняте таке рішення і до чого тут ChatGPT
По темi
OpenAI напряму працюватиме з канадськими правоохоронцями після масової стрілянини в школі, вчиненої трансгендеркою. Чому прийняте таке рішення і до чого тут ChatGPT
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
3 коментарі
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
2 коментарі
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті. 

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.