🚀💳 Trustee Plus - більше ніж криптогаманець з європейською платіжною карткою. Спробуй 👉
Олександр КузьменкоШІ
25 березня 2025, 12:22
2025-03-25
DeepSeek випустила оновлення для своєї моделі V3, яке робить її кращою в програмуванні
Китайська компанія DeepSeek опублікувала оновлення V3-0324 для своєї моделі штучного інтелекту. У стартапі заявляють, що апдейт покращив можливості ШІ в програмуванні та розв’язанні математичних задач, і збільшив кількість параметрів моделі до 685 млрд.
Китайська компанія DeepSeek опублікувала оновлення V3-0324 для своєї моделі штучного інтелекту. У стартапі заявляють, що апдейт покращив можливості ШІ в програмуванні та розв’язанні математичних задач, і збільшив кількість параметрів моделі до 685 млрд.
DeepSeek-V3-0324, названа на честь свого попередника і дати запуску, має «розширені можливості міркування, оптимізовану інтерфейсну веброзробку і покращену китайську писемність», повідомляє South China Morning Post.
Оновлена фундаментальна модель покращила результати в декількох бенчмарках, особливо в Американському іспиті з математики (AIME), де вона набрала 59,4 бала порівняно з 39,6 у попередньої версії, а на LiveCodeBench збільшила свій результат на 10 балів до 49,2 бала, відзначають в DeepSeek.
У порівнянні з DeepSeek V3, яка має 671 мільярд параметрів і використовує власну комерційну ліцензію компанії, нова модель із 685 мільярдами параметрів використовує ліцензію на програмне забезпечення MIT, яка є найпопулярнішою на платформі для розробників GitHub.
Запущена на ШІ-спільноті Hugging Face, а також на власному вебсайті компанії, DeepSeek-V3-0324 зараз є найпопулярнішою моделлю на Hugging Face, отримуючи позитивні відгуки про свою роботу.
Проведене тестування показало, що ця модель працює значно краще, ніж її попередниця, і може змагатися із подібними моделями «міркувань» конкурентів, зокрема o3-mini від OpenAI, поділився враженнями підприємець Поль Готьє у соцмережі X.
Джаспер Чжан, золотий призер олімпіади з математики, який закінчив Каліфорнійський університет у Берклі з докторським ступенем, перевірив модель на задачі AIME 2025, і «вона вирішила її без проблем».
«Більш впевнені моделі ШІ з відкритим вихідним кодом в кінцевому підсумку переможуть», — сказав Чжан в X (Twitter). Він додав, що його стартап Hyperbolic тепер підтримує DeepSeek-V3-0324 на своїй хмарній платформі.
Нагадаємо, наприкінці грудня 2024 року стало відомо, що китайська компанія DeepSeek представила свою нову відкриту ШІ-модель — DeepSeek V3, яка нагадує ChatGPT.
Уже за місяць, у 20 числах січня компанія представила нову версію ШІ — DeepSeek-R1. Розробники стверджують, що вона не поступається «вдумливій» моделі o1 від OpenAI за продуктивністю та ціновою доступністю.
Ще за тиждень після презентації нової моделі, акції азійських техкомпаній почали падати.
Оскільки R1 була випущена через кілька тижнів після DeepSeek-V3, є припущення, що нова модель міркувань може бути представлена незабаром після DeepSeek-V3-0324. DeepSeek планувала випустити R2 на початку травня, але може зробити це раніше, повідомляв Reuters.
«Можливості програмування набагато сильніші, і нова версія може прокласти шлях до запуску R2», — сказав Лі Бангжу, засновник AIcpb.com, вебсайту, який відстежує популярність додатків зі штучним інтелектом.
Хочу стати програмістом. З чого почати і як вибрати між Java Script, PHP, Python та іншими
Діана Смелікова, операційний директор Wezom Academy, у своєму блозі на DOU пояснила, з чого почати вивчати програмування та яким мовам варто налагодити перевагу на початковому етапі. Ось 5 важливих порад від неї.