🚀💳 Trustee Plus - більше ніж криптогаманець з європейською платіжною карткою. Спробуй 👉

DeepSeek розробляє новий метод покращення можливостей міркувань LLM: він допоможе орієнтувати ШІ-моделі на людські вподобання

DeepSeek разом із дослідниками Університету Цінхуа розробив техніку, яка поєднує два методи: генеративне моделювання винагороди (GRM) і самостійне налаштування критики. Цей подвійний підхід може допомогти LLM надавати кращі та швидші результати на загальні запити.

Залишити коментар
DeepSeek розробляє новий метод покращення можливостей міркувань LLM: він допоможе орієнтувати ШІ-моделі на людські вподобання

DeepSeek разом із дослідниками Університету Цінхуа розробив техніку, яка поєднує два методи: генеративне моделювання винагороди (GRM) і самостійне налаштування критики. Цей подвійний підхід може допомогти LLM надавати кращі та швидші результати на загальні запити.

Новий метод має на меті допомогти моделям штучного інтелекту краще дотримуватися людських уподобань, пропонуючи винагороду за більш точні та зрозумілі відповіді, говориться у статті, опублікованій на платформі arXiv. 

Навчання з підкріпленням довело свою ефективність у прискоренні виконання завдань штучного інтелекту у вузьких галузях і сферах. Однак розширення його на більш загальні моделі виявилося складним завданням — і саме цю проблему команда DeepSeek намагається вирішити за допомогою того, що вона називає самостійним налаштуванням критики

Генеративне моделювання винагороди (GRM) — це процес, який орієнтує LLM на людські уподобання. Цей метод стане ключовим компонентом наступних ШІ-моделей. 

Згідно зі статтею, нова стратегія перевершила наявні методи та моделі за різними тестами, і результат показав кращу продуктивність із меншими обчислювальними ресурсами.

За словами дослідників, DeepSeek має намір зробити GRM-моделі відкритими, але коли саме це буде, не повідомляють. 

У січні китайський стартап DeepSeek представив нову версію ШІ — DeepSeek-R1, яка майже за тиждень випередила свого основного конкурента ChatGPT в App Store в США. Своєю популярністю DeepSeek-R1 спровокувала падіння цін на акції технологічних компаній, включно з топовим виробником графічних процесорів Nvidia (статки його CEO Дженсена Хуанга зменшились на понад $20 млрд). 

Пізніше OpenAI звинуватила китайський DeepSeek у використанні американських моделей ШІ для навчання чат-бота, а в різних країнах почали його блокувати.

Вбивця ChatGPT та Nvidia. Як китайська DeepSeek ідеально застосувала принцип «дешево і сердито» до ШІ-моделі сколихнувши цим світові ринки
Вбивця ChatGPT та Nvidia. Як китайська DeepSeek ідеально застосувала принцип «дешево і сердито» до ШІ-моделі, сколихнувши цим світові ринки
По темi
Вбивця ChatGPT та Nvidia. Як китайська DeepSeek ідеально застосувала принцип «дешево і сердито» до ШІ-моделі, сколихнувши цим світові ринки
У DeepSeek заявили що постраждали від масштабної кібератаки й обмежили реєстрацію користувачів
У DeepSeek заявили, що постраждали від масштабної кібератаки й обмежили реєстрацію користувачів
По темi
У DeepSeek заявили, що постраждали від масштабної кібератаки й обмежили реєстрацію користувачів
В Україні зареєстрували однойменні з DeepSeek домени й вже рекламують казино
В Україні зареєстрували однойменні з DeepSeek домени й вже рекламують казино
По темi
В Україні зареєстрували однойменні з DeepSeek домени й вже рекламують казино
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
1 коментар
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті. 

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.