Олександр Кузьменко ШІ 29 січня 2025, 13:22

Китайська Alibaba випустила нову модель ШІ, яка нібито перевершує V3 від DeepSeek та Llama від Meta

Alibaba Group опублікувала результати тестів моделі ШІ Qwen 2.5 Max і заявила, що вона демонструє провідні світові показники.

Залишити коментар

Китайська Alibaba випустила нову модель ШІ, яка нібито перевершує V3 від DeepSeek та Llama від Meta

Alibaba Group опублікувала результати тестів моделі ШІ Qwen 2.5 Max і заявила, що вона демонструє провідні світові показники.

Зокрема, оновлена версія Qwen 2.5 Max у різних тестах показала кращі результати, ніж Llama від Meta Platforms Inc. і модель V3 від іншої китайської компанії DeepSeek, повідомляє Bloomberg.

Разом із Tencent Holdings Ltd. і Baidu Inc. Alibaba вклала значні ресурси у свій сегмент хмарних сервісів і бере участь у наборі китайських розробників ШІ для використання своїх інструментів.

Як відзначає Reuters, Alibaba вибрала цікавий час для свого гучного релізу — перший день Нового року за місячним календарем, коли більшість китайців не працюють, а відпочивають із сім’ями. Це вказує на те, що тиск, який спричинило стрімке зростання китайського ШІ-стартапу DeepSeek, впливає не лише на західних конкурентів, але й на внутрішню конкуренцію.

Лише 10 січня DeepSeek випустила ШІ-асистента на базі моделі DeepSeek-V3, а вже за 10 представила модель R1, яка шокувала Кремнієву долину своєю нібито низькою вартістю навчання та призвели до падіння акцій технологічних компаній. Це змусило інвесторів поставити під сумнів величезні плани витрат провідних ШІ-компаній в США.

Успіх DeepSeek також призвів до того, що його китайські конкуренти також поспішають вдосконалити власні моделі штучного інтелекту.
Через два дні після виходу DeepSeek-R1 власник TikTok, компанія ByteDance, випустила оновлення своєї флагманської моделі ШІ, яка, як вона стверджує, перевершила o1 від OpenAI, що підтримується Microsoft, в AIME — еталонному тесті, який вимірює, наскільки добре моделі ШІ розуміють і реагують на складні інструкції.

У той час як великі китайські технологічні компанії, такі як Alibaba, мають сотні тисяч співробітників, DeepSeek працює як дослідницька лабораторія, укомплектована переважно молодими випускниками та докторантами провідних китайських університетів.

У липні загадковий засновник DeepSeek Лян Венфенг сказав, що, на його думку, найбільші технологічні компанії Китаю не дуже добре підходять для майбутнього індустрії ШІ, через їхні високі витрати й вертикальні структури управління. Натомість робота DeepSeek базується на ощадливості й вільному стилю управління. «Великі фундаментальні моделі вимагають постійних інновацій, можливості технологічних гігантів мають свої межі», — сказав він.

Нагадаємо, що компанія OpenAI заявила, що китайські компанії «постійно» намагаються використати американських конкурентів, щоб удосконалити свої моделі ШІ. Раніше очільник OpenAI Сем Альтман прокоментував хайп довкола моделей штучного інтелекту від китайської DeepSeek. Він назвав їх «дивовижними», але впевнений, що його компанія, може зробити кращі.

Хайп довкола китайських ШІ

DeepSeek, китайська лабораторія штучного інтелекту, що фінансується в основному компанією High-Flyer Capital Management, нещодавно стала популярною після того, як її чатбот піднявся на вершину чартів Apple App Store.

Мовні моделі DeepSeek, які були навчені за допомогою ефективних обчислювальних методів, змусили багатьох аналітиків і технологів на Заході замислитися над тим, чи зможуть США утримати лідерство в перегонах ШІ й чи збережеться попит на ШІ-чіпи.

Це хвилювання спровокувало падіння цін на акції технологічних компаній, включно з топовим виробником графічних процесорів Nvidia, а Марк Цукерберг поспішив із заявою, що Meta планує вкласти $60 млрд у 2025 році в розвиток ШІ.

Хайп довкола DeepSeek став таким великим, що навіть співзасновник monobank Олег Гороховський та очільник Мінцифри Михайло Федоров написали, загадкові лаконічні пости про стартап. Останній згодом опублікував розгорнутіший допис в Telegram.

dev.ua зробив детальний розбір того, як DeepSeek вдалося перевершити конкурентів.

DeepSeek також випустила новий набір мультимодальних моделей штучного інтелекту. У китайській компанії стверджують, що вони можуть перевершити генератор зображень DALL-E 3 від OpenAI.

ChatGPT знижує вартість користування Plus-версією на тлі популярності китайського DeepSeek.

Читайте головні IT-новини країни в нашому Telegram

«Дані мільйонів італійців під загрозою»: Італія стала першою країною яка офіційно звернулася до DeepSeek щодо обробки даних своїх громадян

OpenAI звинувачує китайський DeepSeek у використанні американських моделей ШІ для навчання чат-бота. Компанія виявила докази «дистиляції» моделі

ChatGPT знижує вартість користування Plus-версією на фоні популярності китайського DeepSeek. Якими будуть ціни й кому доступні

Залишити коментар

Текст: Олександр Кузьменко Фото: The Decoder Джерело: Bloomberg Теги: alibaba, deepseek, meta, штучний інтелект

Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».

Розміщення реклами

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Жодних ігор у метавсесвіті: Facebook припинить підтримку свого сервісу для геймерів

«В жовтні випускаємо VR-шолом для аватарів, в «чіпування» Neuralink Маска вірю мало». Про що глава Meta Цукерберг 3 години говорив в подкасті Джо Рогана

25 серпня вийшла чергова серія популярного подкасту The Joe Rogan Experience, гостем якого став глава компанії Meta Марк Цукерберг. Розповідаємо про головне з майже 3-годинного інтерв’ю.

Марк Цукерберг показав нове зображення свого метавсесвіту. Він виглядає просто жахливо

1 коментар

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Коментарів поки немає.

Увійдіть, щоб залишити коментар