UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉
Ігор Вишневський ШІ
19 листопада 2025, 09:08
2025-11-19
«Парадокс Gemini в тому, що в реальному житті він показує себе не дуже в порівнянні з Claude та ChatGPT. І я не розумію, чому, враховуючи такі показники». Експерти — про нову модель Gemini 3 від Google
Експерт зі штучного інтелекту, автор низки книг і курсів із ШІ Олександр Краковецький, оцінюючи нову модель Gemini 3 від Google, назвав її проривом, якщо спиратися на бенчмарки.
Експерт зі штучного інтелекту, автор низки книг і курсів із ШІ Олександр Краковецький, оцінюючи нову модель Gemini 3 від Google, назвав її проривом, якщо спиратися на бенчмарки.
«Наприклад, один з найскладніших бенчмарків — Humanity’s Last Exam Gemini 3 проходить на 37,5%, а у форматі використання інструментів — на неймовірних 45,8%. У GPT-5.1 — „всього“ 26,5%, у Gemini 2.5 Pro — 13,7%», — зазначив він у дописі на своєму Facebook.
Також він відзначив покращений бенчмарк MRCR, що оцінює роботу з довгим контекстом. «Було 58%, стало 77%, це крутий результат», — констатував він.
Водночас Краковецький висловив і свою суб'єктивну думку щодо моделей Gemini, зазначивши, що між бенчмарками й реальним використанням він усе ж відчуває суттєву різницю.
«Суб'єктивщина: парадокс Gemini в тому, що в реальному житті Gemini показує себе не дуже у порівнянні з Claude та ChatGPT. І я не дуже розумію, чому, враховуючи такі показники», — додав експерт.
Своєю чергою експерт із ШІ Олексій Мінаков також акцентував на тому, що Gemini 3.0 Pro майже за всіма бенчмарками перевершує GPT-5.1.
«В Google AI Studio вже можна безоплатно потестувати її. Наприклад, поставив їй контрольне запитання — як Україні перемогти росію у повномасштабній війні. Окремо відзначу маркетинг цієї моделі — напередодні типу „випадково“ злили (розмістили на сайті) результати складання тестів цією моделлю. Щоб підігріти інтерес, фактично анонсувати в такий спосіб», — написав він на своїй сторінці у FB.
Олексій Мінаков констатував, що якщо вірити бенчмаркам, то зараз це найкраща модель серед усіх саме для виконання складних і великих завдань, де потрібні розрахунки та елементи логіки й розмірковувань.