🚀💳 Trustee Plus - більше ніж криптогаманець з європейською платіжною карткою. Спробуй 👉

Alibaba випустила Qwen3, сімейство «гібридних» ШІ-моделей міркувань

Китайська Alibaba представила Qwen3 — сімейство моделей штучного інтелекту. Їхній розмір варіюється від 0,6 млрд до 235 млрд параметрів. 

Залишити коментар
Alibaba випустила Qwen3, сімейство «гібридних» ШІ-моделей міркувань

Китайська Alibaba представила Qwen3 — сімейство моделей штучного інтелекту. Їхній розмір варіюється від 0,6 млрд до 235 млрд параметрів. 

Більшість моделей доступні — або незабаром будуть доступні — для завантаження під «відкритою» ліцензією на платформі для розробників ШІ Hugging Face і GitHub, повідомляє TechCrunch.

Згідно з Alibaba, Qwen3 є «гібридними» моделями — вони можуть витрачати час на «міркування» над складними проблемами або швидко відповідати на простіші запити. 

Компанія інтегрувала режими «мислення» і «немислення», що дозволить користувачам налаштовувати бюджети  для конкретних завдань.

Деякі моделі також використовують комбінацію експертної архітектури (MoE), яка може бути більш обчислювально ефективною для відповідей на запити. MoE розбиває завдання на підзадачі та делегує їх меншим, спеціалізованим «експертним» моделям.

Моделі Qwen3 підтримують 119 мов і були навчені на наборі даних понад 36 трлн токенів. Компанія заявила, що Qwen3 навчався на комбінації підручників, «пар запитань-відповідей», фрагментів коду, даних, згенерованих штучним інтелектом тощо.

Ці вдосконалення, разом з іншими, значно розширили можливості Qwen3 порівняно з його попередником, Qwen2, зазначила Alibaba. Жодна з моделей Qwen3, здається, не перевершує новітні моделі, такі як o3 та o4-mini від OpenAI, але вони, однак є сильними учасниками.

На Codeforces, платформі для змагань з програмування, найбільша модель Qwen3 — Qwen-3-235B-A22B — випередила o3-mini від OpenAI та Gemini 2.5 Pro від Google. Qwen-3-235B-A22B також перевершує o3-mini в останній версії AIME, складному математичному тесті, і BFCL, тесті для оцінки здатності моделі «міркувати» про проблеми. Але Qwen-3-235B-A22B не є загальнодоступною — принаймні поки що.

Друга модель Qwen3, Qwen3-32B, яка є публічною, перевершує модель o1 від OpenAI в декількох тестах, включаючи бенчмарк кодування LiveCodeBench.

На додаток до моделей для завантаження, Qwen3 доступний у хмарних провайдерів, включаючи Fireworks AI й Hyperbolic.

Alibaba Group і $52 млрд — стільки китайська компанія планує інвестувати в ШІ протягом наступних 3 років
Alibaba Group і $52 млрд — стільки китайська компанія планує інвестувати в ШІ протягом наступних 3 років
По темi
Alibaba Group і $52 млрд — стільки китайська компанія планує інвестувати в ШІ протягом наступних 3 років
Китайський техгігант Alibaba представив 100 нових ШІ-моделей з відкритим кодом та технологію перетворення тексту у відео
Китайський техгігант Alibaba представив 100 нових ШІ-моделей з відкритим кодом та технологію перетворення тексту у відео
По темi
Китайський техгігант Alibaba представив 100 нових ШІ-моделей з відкритим кодом та технологію перетворення тексту у відео
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
1 коментар
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті. 

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.