UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

DeepSeek представив нову ШІ-модель V3.1-Exp, яку назвав «проміжним кроком до архітектури наступного покоління»

Китайський стартап DeepSeek представив V3.1-Exp, де використовував нову техніку DeepSeek Sparse Attention або DSA.

Залишити коментар
DeepSeek представив нову ШІ-модель V3.1-Exp, яку назвав «проміжним кроком до архітектури наступного покоління»

Китайський стартап DeepSeek представив V3.1-Exp, де використовував нову техніку DeepSeek Sparse Attention або DSA.

Остання версія, створена на базі старішої V3.1, містить механізм, розроблений для дослідження й оптимізації навчання та роботи ШІ. Стартап заявив, що мета моделі — продемонструвати їхні дослідження в напрямку підвищення ефективності при обробці довгих текстових послідовностей, пише Bloomberg.

У дописі на Hugging Face стартап зазначив, що ця версія є «проміжним етапом на шляху до архітектури наступного покоління». Також натякнув, що працює над моделлю у співпраці з китайськими виробниками чипів.

Крім того, DeepSeek оголосив, що зменшує вартість своїх програмних інструментів удвічі. Так, він приєднався до інших китайських стартапів, які знижують ціни, щоб привернути більше користувачів.

Компанія заявила, що її нові моделі підтримують архітектуру FP8 і що вона працює над додаванням підтримки BF16. Теоретично, використання FP8 дозволяє заощаджувати пам’ять і пришвидшувати обчислення.

Моделі штучного інтелекту оперують мільйонами чисел. Використання менших форматів, як-от FP8 і BF16, допомагає збалансувати швидкість та точність, а також дає змогу запускати великі моделі на менш потужному обладнанні.

Хоча FP8 не є дуже точним, він вважається корисним для багатьох завдань ШІ. Формат BF16 (Brain Floating Point 16) вважається точнішим для навчання ШІ-моделей.

DeepSeek тепер маркує весь контент створений ШІ і ці позначки не можна видалити
DeepSeek тепер маркує весь контент, створений ШІ, і ці позначки не можна видалити
По темi
DeepSeek тепер маркує весь контент, створений ШІ, і ці позначки не можна видалити
DeepSeek випустив оновлену модель V3 з підтримкою китайських чипів
DeepSeek випустив оновлену модель V3 з підтримкою китайських чипів
По темi
DeepSeek випустив оновлену модель V3 з підтримкою китайських чипів
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
3 коментарі
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
2 коментарі
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті. 

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.