Олександр Кузьменко ШІ 21 січня 2025, 15:59

Китайський стартап DeepSeek випустив ШІ-модель рівня o1 від OpenAI й пропонує на 90% дешевшу підписку

Китайський стартап DeepSeek, який лише нещодавно продемонстрував велику мовну модель DeepSeek V3, представив нову версію ШІ — DeepSeek-R1. Розробники стверджують, що вона не поступається «вдумливій» моделі o1 від OpenAI за продуктивністю та ціновою доступністю.

Залишити коментар

Китайський стартап DeepSeek випустив ШІ-модель рівня o1 від OpenAI й пропонує на 90% дешевшу підписку

Китайський стартап DeepSeek, який лише нещодавно продемонстрував велику мовну модель DeepSeek V3, представив нову версію ШІ — DeepSeek-R1. Розробники стверджують, що вона не поступається «вдумливій» моделі o1 від OpenAI за продуктивністю та ціновою доступністю.

DeepSeek-R1, як і o1, яка тренувалася за методом навчання з підкріпленням (RL), але в DeepSeek говорять, що крім цього застосували контрольоване тонке налаштування, щоб впоратися зі складними завданнями на міркування і відповідати продуктивності o1. Про це повідомляє VentureBeat.

Щоб продемонструвати переваги свого підходу, DeepSeek використовував R1 для дистиляції шести моделей Llama і Qwen, піднявши їх продуктивність на новий рівень. В одному випадку, дистильована версія Qwen-1.5B перевершила набагато більші моделі, GPT-4o і Claude 3.5 Sonnet, в окремих математичних тестах.

Ці моделі, як і основна R1, були розроблені з відкритим вихідним кодом і доступні на Hugging Face за ліцензією Массачусетського технологічного інституту.

Під час тестування DeepSeek-R1 набрала 79,8% на математичних тестах AIME 2024 і 97,3% на тесті MATH-500. Вона також отримала 2 029 балів на Codeforces, перевершивши 96,3% програмістів-людей. В цих тестах версія o1-1217 набрала 79,2%, 96,4% та 96,6% відповідно. В тесті на загальні знання на MMLU, R1 трохи поступилася з точністю 90,8% проти 91,8% в o1.

Ефективність DeepSeek-R1 називають великим досягненням китайського стартапу у сфері ШІ, де наразі переважно домінують компанії з США. Крім того, DeepSeek працює за моделлю open source і відкриває доступ навіть до навчальних матеріалів.

Ще однією перевагою DeepSeek для користувачів є її цінова політика. OpenAI надає доступ до o1 за ціною $15 за мільйон вхідних токенів і $60 за мільйон вихідних токенів. Натомість DeepSeek Reasoner, заснований на моделі R1, коштує $0,55 за мільйон вхідних токенів і $2,19 за мільйон вихідних токенів.

Наразі модель можна протестувати на платформі чату DeepSeek, яка нагадує ChatGPT. Користувачі також можуть отримати доступ до вагових коефіцієнтів моделі та репозиторію коду через Hugging Face, за ліцензією MIT, або скористатися API для прямої інтеграції.

Нагадаємо, що з внутрішнім порівняльним тестуванням DeepSeek, модель DeepSeek V3, на якій базується R1, перевершує як завантажувані, «відкрито» доступні моделі, так і «закриті» моделі ШІ, доступ до яких можна отримати лише через API. У низці змагань з програмування на платформі Codeforces, DeepSeek випереджає інші моделі, зокрема Llama 3.1 405B від Meta, GPT-4o від OpenAI та Qwen 2.5 72B від Alibaba.

Читайте головні IT-новини країни в нашому Telegram

Китайці запустили одну з найпотужніших відкритих ШІ-моделей DeepSeek V3 яка добре працює з кодом але не дуже охоче відповідає на питання стосовно країни розробника

OpenAI наблизилася до випуску ШІ-агента який може контролювати ПК та виконувати дії замість користувача: що показали тести

2025 рік називають роком ШІ-агентів. Чи дійсно AI-агенти — must have для всіх і над якими ШІ-асистентами працюють українські підрозділи EPAM Intetics Levi9 P2H та Railsware

Залишити коментар

Текст: Олександр Кузьменко Фото: DeepSeek Джерело: VentureBeat Теги: deepseek, openai, штучний інтелект

Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».

Розміщення реклами

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Штучний інтелект почав озвучувати фільми на MEGOGO

3 коментарі

Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

2 коментарі

«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого

Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Коментарів поки немає.

Увійдіть, щоб залишити коментар