Наталя Хандусенко ШІ 7 квітня 2025, 16:05

DeepSeek розробляє новий метод покращення можливостей міркувань LLM: він допоможе орієнтувати ШІ-моделі на людські вподобання

DeepSeek разом із дослідниками Університету Цінхуа розробив техніку, яка поєднує два методи: генеративне моделювання винагороди (GRM) і самостійне налаштування критики. Цей подвійний підхід може допомогти LLM надавати кращі та швидші результати на загальні запити.

Залишити коментар

DeepSeek розробляє новий метод покращення можливостей міркувань LLM: він допоможе орієнтувати ШІ-моделі на людські вподобання

DeepSeek разом із дослідниками Університету Цінхуа розробив техніку, яка поєднує два методи: генеративне моделювання винагороди (GRM) і самостійне налаштування критики. Цей подвійний підхід може допомогти LLM надавати кращі та швидші результати на загальні запити.

Новий метод має на меті допомогти моделям штучного інтелекту краще дотримуватися людських уподобань, пропонуючи винагороду за більш точні та зрозумілі відповіді, говориться у статті, опублікованій на платформі arXiv.

Навчання з підкріпленням довело свою ефективність у прискоренні виконання завдань штучного інтелекту у вузьких галузях і сферах. Однак розширення його на більш загальні моделі виявилося складним завданням — і саме цю проблему команда DeepSeek намагається вирішити за допомогою того, що вона називає самостійним налаштуванням критики.

Генеративне моделювання винагороди (GRM) — це процес, який орієнтує LLM на людські уподобання. Цей метод стане ключовим компонентом наступних ШІ-моделей.

Згідно зі статтею, нова стратегія перевершила наявні методи та моделі за різними тестами, і результат показав кращу продуктивність із меншими обчислювальними ресурсами.

За словами дослідників, DeepSeek має намір зробити GRM-моделі відкритими, але коли саме це буде, не повідомляють.

У січні китайський стартап DeepSeek представив нову версію ШІ — DeepSeek-R1, яка майже за тиждень випередила свого основного конкурента ChatGPT в App Store в США. Своєю популярністю DeepSeek-R1 спровокувала падіння цін на акції технологічних компаній, включно з топовим виробником графічних процесорів Nvidia (статки його CEO Дженсена Хуанга зменшились на понад $20 млрд).

Пізніше OpenAI звинуватила китайський DeepSeek у використанні американських моделей ШІ для навчання чат-бота, а в різних країнах почали його блокувати.

Вбивця ChatGPT та Nvidia. Як китайська DeepSeek ідеально застосувала принцип «дешево і сердито» до ШІ-моделі сколихнувши цим світові ринки

У DeepSeek заявили що постраждали від масштабної кібератаки й обмежили реєстрацію користувачів

В Україні зареєстрували однойменні з DeepSeek домени й вже рекламують казино

Читайте головні IT-новини країни в нашому Telegram

Залишити коментар

Текст: Наталя Хандусенко Фото: South China Morning Post Теги: deepseek, llm, ші, штучний інтелект

Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».

Розміщення реклами

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Штучний інтелект почав озвучувати фільми на MEGOGO

3 коментарі

Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

2 коментарі

«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого

Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Коментарів поки немає.

Увійдіть, щоб залишити коментар