Наталя Хандусенко ШІ 29 квітня 2025, 16:18

Alibaba випустила Qwen3, сімейство «гібридних» ШІ-моделей міркувань

Китайська Alibaba представила Qwen3 — сімейство моделей штучного інтелекту. Їхній розмір варіюється від 0,6 млрд до 235 млрд параметрів.

Залишити коментар

Alibaba випустила Qwen3, сімейство «гібридних» ШІ-моделей міркувань

Китайська Alibaba представила Qwen3 — сімейство моделей штучного інтелекту. Їхній розмір варіюється від 0,6 млрд до 235 млрд параметрів.

Більшість моделей доступні — або незабаром будуть доступні — для завантаження під «відкритою» ліцензією на платформі для розробників ШІ Hugging Face і GitHub, повідомляє TechCrunch.

Згідно з Alibaba, Qwen3 є «гібридними» моделями — вони можуть витрачати час на «міркування» над складними проблемами або швидко відповідати на простіші запити.

Компанія інтегрувала режими «мислення» і «немислення», що дозволить користувачам налаштовувати бюджети для конкретних завдань.

Деякі моделі також використовують комбінацію експертної архітектури (MoE), яка може бути більш обчислювально ефективною для відповідей на запити. MoE розбиває завдання на підзадачі та делегує їх меншим, спеціалізованим «експертним» моделям.

Моделі Qwen3 підтримують 119 мов і були навчені на наборі даних понад 36 трлн токенів. Компанія заявила, що Qwen3 навчався на комбінації підручників, «пар запитань-відповідей», фрагментів коду, даних, згенерованих штучним інтелектом тощо.

Ці вдосконалення, разом з іншими, значно розширили можливості Qwen3 порівняно з його попередником, Qwen2, зазначила Alibaba. Жодна з моделей Qwen3, здається, не перевершує новітні моделі, такі як o3 та o4-mini від OpenAI, але вони, однак є сильними учасниками.

На Codeforces, платформі для змагань з програмування, найбільша модель Qwen3 — Qwen-3-235B-A22B — випередила o3-mini від OpenAI та Gemini 2.5 Pro від Google. Qwen-3-235B-A22B також перевершує o3-mini в останній версії AIME, складному математичному тесті, і BFCL, тесті для оцінки здатності моделі «міркувати» про проблеми. Але Qwen-3-235B-A22B не є загальнодоступною — принаймні поки що.

Друга модель Qwen3, Qwen3-32B, яка є публічною, перевершує модель o1 від OpenAI в декількох тестах, включаючи бенчмарк кодування LiveCodeBench.

На додаток до моделей для завантаження, Qwen3 доступний у хмарних провайдерів, включаючи Fireworks AI й Hyperbolic.

Alibaba Group і $52 млрд — стільки китайська компанія планує інвестувати в ШІ протягом наступних 3 років

Китайський техгігант Alibaba представив 100 нових ШІ-моделей з відкритим кодом та технологію перетворення тексту у відео

Читайте головні IT-новини країни в нашому Telegram

Залишити коментар

Текст: Наталя Хандусенко Фото: South China Morning Post Теги: alibaba, ші, штучний інтелект

Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».

Розміщення реклами

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Штучний інтелект почав озвучувати фільми на MEGOGO

3 коментарі

Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

2 коментарі

«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого

Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Коментарів поки немає.

Увійдіть, щоб залишити коментар