Олександр Кузьменко ШІ 25 березня 2025, 12:22

DeepSeek випустила оновлення для своєї моделі V3, яке робить її кращою в програмуванні

Китайська компанія DeepSeek опублікувала оновлення V3-0324 для своєї моделі штучного інтелекту. У стартапі заявляють, що апдейт покращив можливості ШІ в програмуванні та розв’язанні математичних задач, і збільшив кількість параметрів моделі до 685 млрд.

Залишити коментар

DeepSeek випустила оновлення для своєї моделі V3, яке робить її кращою в програмуванні

Китайська компанія DeepSeek опублікувала оновлення V3-0324 для своєї моделі штучного інтелекту. У стартапі заявляють, що апдейт покращив можливості ШІ в програмуванні та розв’язанні математичних задач, і збільшив кількість параметрів моделі до 685 млрд.

DeepSeek-V3-0324, названа на честь свого попередника і дати запуску, має «розширені можливості міркування, оптимізовану інтерфейсну веброзробку і покращену китайську писемність», повідомляє South China Morning Post.

Оновлена фундаментальна модель покращила результати в декількох бенчмарках, особливо в Американському іспиті з математики (AIME), де вона набрала 59,4 бала порівняно з 39,6 у попередньої версії, а на LiveCodeBench збільшила свій результат на 10 балів до 49,2 бала, відзначають в DeepSeek.

У порівнянні з DeepSeek V3, яка має 671 мільярд параметрів і використовує власну комерційну ліцензію компанії, нова модель із 685 мільярдами параметрів використовує ліцензію на програмне забезпечення MIT, яка є найпопулярнішою на платформі для розробників GitHub.

Запущена на ШІ-спільноті Hugging Face, а також на власному вебсайті компанії, DeepSeek-V3-0324 зараз є найпопулярнішою моделлю на Hugging Face, отримуючи позитивні відгуки про свою роботу.

Проведене тестування показало, що ця модель працює значно краще, ніж її попередниця, і може змагатися із подібними моделями «міркувань» конкурентів, зокрема o3-mini від OpenAI, поділився враженнями підприємець Поль Готьє у соцмережі X.

Джаспер Чжан, золотий призер олімпіади з математики, який закінчив Каліфорнійський університет у Берклі з докторським ступенем, перевірив модель на задачі AIME 2025, і «вона вирішила її без проблем».

«Більш впевнені моделі ШІ з відкритим вихідним кодом в кінцевому підсумку переможуть», — сказав Чжан в X (Twitter). Він додав, що його стартап Hyperbolic тепер підтримує DeepSeek-V3-0324 на своїй хмарній платформі.

Нагадаємо, наприкінці грудня 2024 року стало відомо, що китайська компанія DeepSeek представила свою нову відкриту ШІ-модель — DeepSeek V3, яка нагадує ChatGPT.

Уже за місяць, у 20 числах січня компанія представила нову версію ШІ — DeepSeek-R1. Розробники стверджують, що вона не поступається «вдумливій» моделі o1 від OpenAI за продуктивністю та ціновою доступністю.

Ще за тиждень після презентації нової моделі, акції азійських техкомпаній почали падати.

Оскільки R1 була випущена через кілька тижнів після DeepSeek-V3, є припущення, що нова модель міркувань може бути представлена незабаром після DeepSeek-V3-0324. DeepSeek планувала випустити R2 на початку травня, але може зробити це раніше, повідомляв Reuters.

«Можливості програмування набагато сильніші, і нова версія може прокласти шлях до запуску R2», — сказав Лі Бангжу, засновник AIcpb.com, вебсайту, який відстежує популярність додатків зі штучним інтелектом.

Читайте головні IT-новини країни в нашому Telegram

Міністерство торгівлі США заборонило китайський DeepSeek на державних пристроях

Китайська Baidu представила безплатні нові ШІ-моделі EARNIE X1 та ERNIE 4.5 стверджуючи що друга відповідає DeepSeek R1 за ціною вдвічі нижчою

В Google представили Gemma 3 і стверджують що модель лише на одному графічному процесорі має 98% точності DeepSeek

Залишити коментар

Текст: Олександр Кузьменко Фото: PBS Джерело: South China Morning Post Теги: deepseek, deepseek v3, програмування, штучний інтелект

Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».

Розміщення реклами

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Хочу стати програмістом. З чого почати і як вибрати між Java Script, PHP, Python та іншими

Діана Смелікова, операційний директор Wezom Academy, у своєму блозі на DOU пояснила, з чого почати вивчати програмування та яким мовам варто налагодити перевагу на початковому етапі. Ось 5 важливих порад від неї.

Штучний інтелект почав озвучувати фільми на MEGOGO

3 коментарі

Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

2 коментарі

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Коментарів поки немає.

Увійдіть, щоб залишити коментар