Хостинг для будь-яких потреб — VPS від 135 гривень на місяць 👉
Олександр КузьменкоШІ
26 червня 2025, 17:36
2025-06-26
Нова модель ШІ R2 від DeepSeek затримується через санкції США на чипи Nvidia
Майбутня велика мовна модель R2 від китайського стартапу DeepSeek стикається з проблемами через дефіцит серверних чипів Nvidia H20. Крім того, CEO DeepSeek все ще не влаштовує продуктивність нової моделі.
Майбутня велика мовна модель R2 від китайського стартапу DeepSeek стикається з проблемами через дефіцит серверних чипів Nvidia H20. Крім того, CEO DeepSeek все ще не влаштовує продуктивність нової моделі.
Дефіцит GPU для ШІ в Китаї посилився після нещодавньої заборони США на чипи H20 від Nvidia, які були спеціально розроблені для китайського ринку. Про це повідомляє Investing з посиланням на The Information. Наразі більшість компаній, які зараз використовують популярну модель R1 від DeepSeek, працюють на цих чіпах H20.
Хоча інженери вже кілька місяців інтенсивно працюють над новою моделлю, генеральний директор DeepSeek Лян Венфен ще не задоволений її продуктивністю. Компанія ще не визначила, коли буде випущена R2.
Наразі інженери стартапу продовжують вдосконалювати R2 і випустять її тільки після отримання схвалення від Ляна. Якщо після релізу R2 перевершить чинні моделі з відкритим кодом, очікується, що попит перевершить можливості китайських хмарних провайдерів, які вже стикаються з дефіцитом чіпів Nvidia.
Що за модель R2
DeepSeek R2 — це довгоочікуваний наступник DeepSeek R1, моделі штучного інтелекту, яка взимку наробила галасу в техіндустрії. Очікується, що R2 запропонує вдосконалені можливості кодування, багатомовне міркування та підвищену обчислювальну ефективність.
DeepSeek R2 має бути мультимодальною моделлю, що означає, що вона зможе обробляти не тільки текст, але й зображення, аудіо та, можливо, навіть відео, що зробить її більш універсальною системою штучного інтелекту. Деталі про її точну архітектуру залишаються невідомими, але інсайдери галузі припускають, що вона буде мати розширені навчальні набори даних для підкріплювального навчання (RL).
Випуск DeepSeek R2 був запланований на травень 2025 року, щоб використати імпульс, створений R1, проте модель досі не вийшла.