Наталя Хандусенко ШІ 1 травня 2025, 10:56

Microsoft випустила три нові ШІ-моделі міркувань Phi 4, які дозволяють виконувати складні завдання навіть на слабких пристроях

Microsoft представила кілька нових відкритих ШІ-моделей міркувань Phi 4, які можуть конкурувати з OpenAI o3-mini.

Усі три моделі — Phi 4 mini reasoning, Phi 4 reasoning і Phi 4 reasoning plus — є моделями «міркування», тобто вони здатні витрачати більше часу на перевірку фактів при вирішенні складних завдань. Вони розширюють сімейство «малих моделей» Phi від Microsoft, яке компанія запустила рік тому, пише TechCrunch.

Phi 4 mini reasoning

Ця модель була навчена на приблизно 1 млн синтетичних математичних задач, згенерованих моделлю міркувань R1 китайського стартапу DeepSeek. Phi 4 mini має близько 3,8 млрд параметрів і призначена для освітніх програм, таких як «вбудоване навчання» на легких пристроях.

Phi 4 reasoning

Phi 4 reasoning має 14 млрд параметрів. Вона була навчена на високоякісних вебданих та ретельно відібраних прикладах з o3-mini від OpenAI. За словами Microsoft. Вона найкраще підходить для завдань пов’язаних з математикою, наукою та програмуванням.

Phi 4 reasoning plus

Це раніше випущена модель Phi-4, адаптована в модель міркувань для досягнення кращої точності. Microsoft стверджує, що Phi 4 reasoning plus наближається до рівня продуктивності R1, моделі зі значно більшою кількістю параметрів (671 млрд). У внутрішньому бенчмаркінгу компанії Phi 4 reasoning plus також відповідає o3-mini на OmniMath, тесті на математичні навички.

Phi 4 mini reasoning, Phi 4 reasoning та Phi 4 reasoning plus доступні на платформі розробки штучного інтелекту Hugging Face разом із детальними технічними звітами.

«Використовуючи дистиляцію, навчання з підкріпленням і високоякісні дані, ці моделі балансують між розміром і продуктивністю, — написала Microsoft у своєму блозі. «Вони досить малі для середовищ з низькою затримкою, але зберігають потужні можливості міркувань, які конкурують з набагато більшими моделями. Таке поєднання дозволяє навіть пристроям з обмеженими ресурсами ефективно виконувати складні обчислювальні завдання».

Нагадаємо, що днями Xiaomi запустила свою першу ШІ-модель MiMo. Це модель міркувань з відкритим вихідним кодом, яка повністю навчена власними силами компанії.