UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉
Наталя ХандусенкоШІ
19 вересня 2025, 09:13
2025-09-19
Оновлена модель міркування Magistral Small 1.2 від Mistral аналізує зображення та може вміститися на MacBook
Французька ШІ-компанія Mistral випустила нову пару моделей — Magistral Small 1.2 та Magistral Medium 1.2 LLM. Обидві моделі оснащені візуальним енкодером, що дозволяє їм аналізувати зображення, які їм надсилають користувачі. До того ж, вони демонструють покращення продуктивності за ключовими бенчмарками, а також розширені функції зручності використання.
Французька ШІ-компанія Mistral випустила нову пару моделей — Magistral Small 1.2 та Magistral Medium 1.2 LLM. Обидві моделі оснащені візуальним енкодером, що дозволяє їм аналізувати зображення, які їм надсилають користувачі. До того ж, вони демонструють покращення продуктивності за ключовими бенчмарками, а також розширені функції зручності використання.
Як зазначив на Х керівник відділу розвитку машинного навчання в Hugging Face Ахсен Халік, найбільш вражаюче те, що версія Magistral Small 1.2 з 24 млрд параметрів — після квантування, тобто перетворення її внутрішніх налаштувань на меншу кількість бітів для економії місця та зменшення енергоспоживання, в обмін на певну втрату точності, — може бути розгорнута локально, «вмістившись на одній [Nvidia] RTX 4090 [GPU] або [Apple] MacBook з 32 ГБ оперативної пам’яті…».
Код уже доступний для завантаження на Hugging Face. Також можна поспілкуватися безпосередньо з моделями на Le Chat — вебсайті чатбота від Mistral і конкурента ChatGPT, пише VentureBeat.
Для розробників моделі доступні через API Mistral за адресами «magistral-small-2509» та «magistral-medium-2509» відповідно.
Ці моделі можна розглядати як варіанти для виконання завдань, що стосуються мови, математики, кодування, логічного аналізу та аналізу зображень.
З випуском оновлень 1.2, Mistral AI демонструє найвищі показники за низкою публічних бенчмарків. Це можна побачити на порівняльних діаграмах нижче.
Джерело: VentureBeat
У математичному бенчмарку AIME24 Magistral Medium 1.2 набрав 91,82%, трохи випереджаючи Deepseek-R1 (91,40%) та значно перевершуючи Magistral Medium 1.0 (73,59%).
Хоча Qwen3-235B-A22B-Thinking незначно лідирує в HMMT25, GPQA Diamond та LiveCodeBench v6, Magistral Medium 1.2 тримається на своїх позиціях та постійно перевершує свої попередні версії та більшість конкурентів у завданнях кодування AIME та LiveCode.
Magistral Small 1.2 також демонструє явні переваги порівняно з версіями 1.0 та 1.1 та конкурує з набагато більшими моделями.
Джерело: VentureBeat
Хоча модель Qwen3-30B-A3b-Thinking лідирує в деяких завданнях, таких як AIME25 та GPQA, Magistral Small 1.2 стабільно перевершує свого попередника та конкурентів, зокрема Qwen3-32B, особливо в тестах, пов’язаних із кодом, як-от LiveCodeBench.
Головною особливістю оновлень версії 1.2 є підтримка мультимодальних входів.
Тепер обидві моделі оснащені візуальним енкодером, який дозволяє їм інтерпретувати та аналізувати текст і зображення. Це доповнення розширює спектр завдань, з якими можуть впоратися моделі, включаючи відповіді на візуальні запитання, інтерпретацію діаграм коду та аналіз макетів.
Mistral наголошує на покращеній структурі міркувань та форматуванні виводу у версії 1.2. Відповіді тепер більш природні та лаконічні, особливо для простих підказок. Покращено підтримку LaTeX та Markdown, що зменшує труднощі для розробників, які працюють над технічними завданнями.
Моделі також стали більш вправними у використанні зовнішніх інструментів, таких як вебпошук, інтерпретатори коду та генератори зображень, з кращою логікою щодо того, коли і як використовувати ці інструменти.
Обидві моделі вводять спеціальні токени [THINK] та [/THINK] для позначення слідів міркувань для легшого перегляду розробниками, що структурує виводи моделі у внутрішні міркування, а потім остаточну відповідь, що корисно для відстеження та налагодження.
Моделі Magistral 1.2 підтримують понад два десятки мов, включаючи французьку, німецьку, арабську, японську та китайську, і розроблені для підтримки якості виводів до контекстного вікна розміром до 128 000 токенів. Однак, Mistral зазначає, що продуктивність оптимальна при 40 000 токенів.
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.
Хочете повідомити важливу новину? Пишіть у Telegram-бот
Головні події та корисні посилання в нашому Telegram-каналі