Реклама партнера — Название партнёра
UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

DeepSeek's new R2 AI model delayed due to US sanctions on Nvidia chips

Chinese startup DeepSeek’s upcoming R2 large-scale language model is facing problems due to a shortage of Nvidia H20 server chips. In addition, DeepSeek’s CEO is still not satisfied with the new model’s performance.

Leave a comment
DeepSeek's new R2 AI model delayed due to US sanctions on Nvidia chips

Chinese startup DeepSeek’s upcoming R2 large-scale language model is facing problems due to a shortage of Nvidia H20 server chips. In addition, DeepSeek’s CEO is still not satisfied with the new model’s performance.

China’s AI GPU shortage has worsened after the recent US ban on Nvidia’s H20 chips, which were specifically designed for the Chinese market, Investing reports with reference to The Information. Most companies currently using DeepSeek’s popular R1 model are currently running on these H20 chips.

Although engineers have been working intensively on the new model for several months, DeepSeek CEO Liang Wenfeng is not yet satisfied with its performance. The company has not yet determined when the R2 will be released.

The startup’s engineers are currently continuing to refine R2 and will only release it after receiving approval from Liang. If R2 outperforms current open-source models upon release, demand is expected to outpace Chinese cloud providers, which are already facing a shortage of Nvidia chips.

What model is R2?

DeepSeek R2 is the long-awaited successor to DeepSeek R1, the AI ​​model that made a splash in the tech industry over the winter. R2 is expected to offer improved coding capabilities, multilingual reasoning, and increased computational efficiency.

DeepSeek R2 is expected to be a multimodal model, meaning it will be able to process not only text but also images, audio, and possibly even video, making it a more versatile AI system. Details about its exact architecture remain unknown, but industry insiders speculate that it will have expanded training datasets for reinforcement learning (RL).

The release of DeepSeek R2 was planned for May 2025 to build on the momentum created by R1, but the model has not yet been released.

Read the country's main IT news in our Telegram
Read the country’s main IT news in our Telegram
On the topic
Read the country’s main IT news in our Telegram
DeepSeek has updated its R1 AI model — it has become even more powerful in programming and love for the Chinese Communist Party
DeepSeek has updated its R1 AI model — it has become even more powerful in programming and love for the Chinese Communist Party
On the topic
DeepSeek has updated its R1 AI model — it has become even more powerful in programming and love for the Chinese Communist Party
DeepSeek has released an update for its V3 model that makes it better for programming
DeepSeek has released an update for its V3 model that makes it better at programming
On the topic
DeepSeek has released an update for its V3 model that makes it better at programming
China is using DeepSeek to develop a new generation of fighter jets. What Chinese designers themselves say
China is using DeepSeek to develop a new generation of fighter jets. What Chinese designers themselves say
On the topic
China is using DeepSeek to develop a new generation of fighter jets. What Chinese designers themselves say
Also Read
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Нейронні мережі для генерації зображень бачать світ по-своєму, їхню логіку зрозуміти часом зовсім неможливо. Але таки хочеться. На честь Дня Незалежності України редакція dev.ua вирішила провести невеликий експеримент. Ми задали чотирьом різним нейронним мережам п’ять однакових запитів: «прапор України», «День Незалежності України», «український Крим», «перемога України» та «українці». Отриманими результатами ми ділимося з вами нижче.
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok з’явилася нова функція «Розумний фон». З її допомогою як фон для тіктоків можна підставляти згенеровані нейромережею зображення. Редакція dev.ua протестувала цю технологію і ділиться своїми враженнями.
1 comment
Які IT-спеціальності будуть потрібні в найближчі п'ять років? Ми з'ясували у голови американського стартапу ADAM Дениса Гурака
Які IT-спеціальності будуть потрібні в найближчі п'ять років? Ми з'ясували у голови американського стартапу ADAM Дениса Гурака
Які IT-спеціальності будуть потрібні в найближчі п'ять років? Ми з'ясували у голови американського стартапу ADAM Дениса Гурака

Have important news to share? Message our Telegram bot

Key events and useful links in our Telegram channel

Discussion
No comments yet.