Наталя Хандусенко ШІ 29 вересня 2025, 18:50

DeepSeek представив нову ШІ-модель V3.1-Exp, яку назвав «проміжним кроком до архітектури наступного покоління»

Китайський стартап DeepSeek представив V3.1-Exp, де використовував нову техніку DeepSeek Sparse Attention або DSA.

Остання версія, створена на базі старішої V3.1, містить механізм, розроблений для дослідження й оптимізації навчання та роботи ШІ. Стартап заявив, що мета моделі — продемонструвати їхні дослідження в напрямку підвищення ефективності при обробці довгих текстових послідовностей, пише Bloomberg.

У дописі на Hugging Face стартап зазначив, що ця версія є «проміжним етапом на шляху до архітектури наступного покоління». Також натякнув, що працює над моделлю у співпраці з китайськими виробниками чипів.

Крім того, DeepSeek оголосив, що зменшує вартість своїх програмних інструментів удвічі. Так, він приєднався до інших китайських стартапів, які знижують ціни, щоб привернути більше користувачів.

Компанія заявила, що її нові моделі підтримують архітектуру FP8 і що вона працює над додаванням підтримки BF16. Теоретично, використання FP8 дозволяє заощаджувати пам’ять і пришвидшувати обчислення.

Моделі штучного інтелекту оперують мільйонами чисел. Використання менших форматів, як-от FP8 і BF16, допомагає збалансувати швидкість та точність, а також дає змогу запускати великі моделі на менш потужному обладнанні.

Хоча FP8 не є дуже точним, він вважається корисним для багатьох завдань ШІ. Формат BF16 (Brain Floating Point 16) вважається точнішим для навчання ШІ-моделей.

DeepSeek тепер маркує весь контент створений ШІ і ці позначки не можна видалити

DeepSeek випустив оновлену модель V3 з підтримкою китайських чипів

Читайте головні IT-новини країни в нашому Telegram

Залишити коментар

Текст: Наталя Хандусенко Теги: deepseek, ші, штучний інтелект

Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».

Розміщення реклами

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Штучний інтелект почав озвучувати фільми на MEGOGO

3 коментарі

Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

2 коментарі

«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого

Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Коментарів поки немає.

Увійдіть, щоб залишити коментар