💳 Потрібна європейська картка з лімітом 50к євро? Встановлюй Trustee Plus 👉
Наталя ХандусенкоШІ
3 лютого 2025, 16:20
2025-02-03
Витрати DeepSeek на ШІ значно більші за заявлені $5,5 млн: аналітики називають зовсім іншу цифру, яка перевищує $1 млрд
Нещодавно китайська компанія DeepSeek кинула багатомільярдну індустрію штучного інтелекту в хаос, випустивши свою модель R1 вартістю лише за $5,576 млн. Однак аналітична компанія SemiAnalysis підрахувала, що справжні витрати DeepSeek сягнули далеко за $1 млрд.
Нещодавно китайська компанія DeepSeek кинула багатомільярдну індустрію штучного інтелекту в хаос, випустивши свою модель R1 вартістю лише за $5,576 млн. Однак аналітична компанія SemiAnalysis підрахувала, що справжні витрати DeepSeek сягнули далеко за $1 млрд.
Заява про те, що DeepSeek змогла навчити R1, використовуючи лише частину ресурсів, необхідних великим технологічним компаніям, які інвестують у ШІ, за один день знизила ціну акцій Nvidia на рекордні $600 млрд. Якщо китайський стартап зміг створити настільки потужну модель, не витрачаючи мільярди на найпотужніші графічні процесори, то що завадить зробити це всім іншим?
Але чи дійсно DeepSeek створила свою модель, яка досі очолює чарти Apple App Store, за таку низьку ціну? Аналітична компанія SemiAnalysis стверджує, що ні.
Згідно з її аналізом, DeepSeek має доступ до близько 50 000 графічних процесорів Hopper, включаючи 10 000 H800 і 10 000 H100. У неї також є замовлення на багато інших H20, призначених для Китаю. Графічні процесори розподілені між High-Flyer, хедж-фондом, що стоїть за DeepSeek, і стартапом. Вони розподілені по декількох географічних точках і використовуються для торгівлі, висновків, навчання та досліджень, пише TechSpot.
SemiAnalysis пише, що DeepSeek інвестувала набагато більше, ніж заявлені $5,5 млн. Це витрати на попереднє навчання ШІ, які складають лише частину від загальної суми. Загальні інвестиції компанії в сервери становлять близько $1,6 млрд, із яких близько $944 млн витрачено на операційні витрати. Інвестиції в графічні процесори, тим часом становлять понад $500 млн.
Зазначається, що DeepSeek залучає всі свої таланти виключно з Китаю. Це контрастує з повідомленнями про те, що інші китайські технологічні компанії, такі як Huawei, намагаються переманити працівників з-за кордону, причому тайванські працівники TSMC є найбільш потрібними цілями. DeepSeek нібито пропонує зарплату понад $1,3 млн перспективним кандидатам, що набагато більше, ніж платять конкурентні китайські компанії, що займаються розробкою штучного інтелекту.
DeepSeek також має перевагу в тому, що здебільшого використовує власні дата-центри, а не покладається на зовнішніх хмарних провайдерів. Це дозволяє більше експериментувати та впроваджувати інновації в стек продуктів ШІ. SemiAnalysis пише, що це найкраща лабораторія у цій «відкритій ваговій категорії» на сьогодні, випередивши Llama від Meta, Mistral та інші.
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.
Хочете повідомити важливу новину? Пишіть у Telegram-бот
Головні події та корисні посилання в нашому Telegram-каналі