🚀💳 Trustee Plus - більше ніж криптогаманець з європейською платіжною карткою. Спробуй 👉

DeepSeek випустила оновлення для своєї моделі V3, яке робить її кращою в програмуванні

Китайська компанія DeepSeek опублікувала оновлення V3-0324 для своєї моделі штучного інтелекту. У стартапі заявляють, що апдейт покращив можливості ШІ в програмуванні та розв’язанні математичних задач, і збільшив кількість параметрів моделі до 685 млрд.

Залишити коментар
DeepSeek випустила оновлення для своєї моделі V3, яке робить її кращою в програмуванні

Китайська компанія DeepSeek опублікувала оновлення V3-0324 для своєї моделі штучного інтелекту. У стартапі заявляють, що апдейт покращив можливості ШІ в програмуванні та розв’язанні математичних задач, і збільшив кількість параметрів моделі до 685 млрд.

DeepSeek-V3-0324, названа на честь свого попередника і дати запуску, має «розширені можливості міркування, оптимізовану інтерфейсну веброзробку і покращену китайську писемність», повідомляє South China Morning Post.

Оновлена фундаментальна модель покращила результати в декількох бенчмарках, особливо в Американському іспиті з математики (AIME), де вона набрала 59,4 бала порівняно з 39,6 у попередньої версії, а на LiveCodeBench збільшила свій результат на 10 балів до 49,2 бала, відзначають в DeepSeek.

У порівнянні з DeepSeek V3, яка має 671 мільярд параметрів і використовує власну комерційну ліцензію компанії, нова модель із 685 мільярдами параметрів використовує ліцензію на програмне забезпечення MIT, яка є найпопулярнішою на платформі для розробників GitHub.

Запущена на ШІ-спільноті Hugging Face, а також на власному вебсайті компанії, DeepSeek-V3-0324 зараз є найпопулярнішою моделлю на Hugging Face, отримуючи позитивні відгуки про свою роботу.

Проведене тестування показало, що ця модель працює значно краще, ніж її попередниця, і може змагатися із подібними моделями «міркувань» конкурентів, зокрема o3-mini від OpenAI, поділився враженнями підприємець Поль Готьє у соцмережі X.

Джаспер Чжан, золотий призер олімпіади з математики, який закінчив Каліфорнійський університет у Берклі з докторським ступенем, перевірив модель на задачі AIME 2025, і «вона вирішила її без проблем».

«Більш впевнені моделі ШІ з відкритим вихідним кодом в кінцевому підсумку переможуть», — сказав Чжан в X (Twitter). Він додав, що його стартап Hyperbolic тепер підтримує DeepSeek-V3-0324 на своїй хмарній платформі.

Нагадаємо, наприкінці грудня 2024 року стало відомо, що китайська компанія DeepSeek представила свою нову відкриту ШІ-модель — DeepSeek V3, яка нагадує ChatGPT.

Уже за місяць, у 20 числах січня компанія представила нову версію ШІ — DeepSeek-R1. Розробники стверджують, що вона не поступається «вдумливій» моделі o1 від OpenAI за продуктивністю та ціновою доступністю.

Ще за тиждень після презентації нової моделі, акції азійських техкомпаній почали падати

Оскільки R1 була випущена через кілька тижнів після DeepSeek-V3, є припущення, що нова модель міркувань може бути представлена незабаром після DeepSeek-V3-0324. DeepSeek планувала випустити R2 на початку травня, але може зробити це раніше, повідомляв Reuters.

«Можливості програмування набагато сильніші, і нова версія може прокласти шлях до запуску R2», — сказав Лі Бангжу, засновник AIcpb.com, вебсайту, який відстежує популярність додатків зі штучним інтелектом.

Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Міністерство торгівлі США заборонило китайський DeepSeek на державних пристроях
Міністерство торгівлі США заборонило китайський DeepSeek на державних пристроях
По темi
Міністерство торгівлі США заборонило китайський DeepSeek на державних пристроях
Китайська Baidu представила безплатні нові ШІ-моделі EARNIE X1 та ERNIE 4.5 стверджуючи що друга відповідає DeepSeek R1 за ціною вдвічі нижчою
Китайська Baidu представила безплатні нові ШІ-моделі EARNIE X1 та ERNIE 4.5, стверджуючи, що друга відповідає DeepSeek R1 за ціною вдвічі нижчою
По темi
Китайська Baidu представила безплатні нові ШІ-моделі EARNIE X1 та ERNIE 4.5, стверджуючи, що друга відповідає DeepSeek R1 за ціною вдвічі нижчою
В Google представили Gemma 3 і стверджують що модель лише на одному графічному процесорі має 98% точності DeepSeek
В Google представили Gemma 3 і стверджують, що модель лише на одному графічному процесорі має 98% точності DeepSeek
По темi
В Google представили Gemma 3 і стверджують, що модель лише на одному графічному процесорі має 98% точності DeepSeek
Підключай Megogo зі знижками за акційними тарифами.

від 99 гривень на місяць

Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Хочу стати програмістом. З чого почати і як вибрати між Java Script, PHP, Python та іншими
Хочу стати програмістом. З чого почати і як вибрати між Java Script, PHP, Python та іншими
Хочу стати програмістом. З чого почати і як вибрати між Java Script, PHP, Python та іншими
Діана Смелікова, операційний директор Wezom Academy, у своєму блозі на DOU пояснила, з чого почати вивчати програмування та яким мовам варто налагодити перевагу на початковому етапі. Ось 5 важливих порад від неї.
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
1 коментар
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.