Реклама партнера — Название партнёра
UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

«Парадокс Gemini в тому, що в реальному житті він показує себе не дуже в порівнянні з Claude та ChatGPT. І я не розумію, чому, враховуючи такі показники». Експерти — про нову модель Gemini 3 від Google

Експерт зі штучного інтелекту, автор низки книг і курсів із ШІ Олександр Краковецький, оцінюючи нову модель Gemini 3 від Google, назвав її проривом, якщо спиратися на бенчмарки. 

Залишити коментар
«Парадокс Gemini в тому, що в реальному житті він показує себе не дуже в порівнянні з Claude та ChatGPT. І я не розумію, чому, враховуючи такі показники». Експерти — про нову модель Gemini 3 від Google

Експерт зі штучного інтелекту, автор низки книг і курсів із ШІ Олександр Краковецький, оцінюючи нову модель Gemini 3 від Google, назвав її проривом, якщо спиратися на бенчмарки. 

«Наприклад, один з найскладніших бенчмарків — Humanity’s Last Exam Gemini 3 проходить на 37,5%, а у форматі використання інструментів — на неймовірних 45,8%. У GPT-5.1 — „всього“ 26,5%, у Gemini 2.5 Pro — 13,7%», — зазначив він у дописі на своєму Facebook. 

Також він відзначив покращений бенчмарк MRCR, що оцінює роботу з довгим контекстом. «Було 58%, стало 77%, це крутий результат», — констатував він. 

Водночас Краковецький висловив і свою суб'єктивну думку щодо моделей Gemini, зазначивши, що між бенчмарками й реальним використанням він усе ж відчуває суттєву різницю.  

«Суб'єктивщина: парадокс Gemini в тому, що в реальному житті Gemini показує себе не дуже у порівнянні з Claude та ChatGPT. І я не дуже розумію, чому, враховуючи такі показники», — додав експерт. 

Своєю чергою експерт із ШІ Олексій Мінаков також акцентував на тому, що Gemini 3.0 Pro майже за всіма бенчмарками перевершує GPT-5.1.

«В Google AI Studio вже можна безоплатно потестувати її. Наприклад, поставив їй контрольне запитання — як Україні перемогти росію у повномасштабній війні. Окремо відзначу маркетинг цієї моделі — напередодні типу „випадково“ злили (розмістили на сайті) результати складання тестів цією моделлю. Щоб підігріти інтерес, фактично анонсувати в такий спосіб», — написав він на своїй сторінці у FB. 

Олексій Мінаков констатував, що якщо вірити бенчмаркам, то зараз це найкраща модель серед усіх саме для виконання складних і великих завдань, де потрібні розрахунки та елементи логіки й розмірковувань.

Як писав dev.ua, напередодні Google представив свою «найрозумнішу модель» ШІ Gemini 3, яка перевершує GPT-5 Pro та Claude Sonnet 4.5. Сама компанія назвала її «найточнішою» й «найрозумнішою» у світі й великим кроком на шляху до AGI.

Вайбкодинг платформа Cursor отримала апґрейд до версії 2.0 і нову ШІ-модель Composer
Вайбкодинг платформа Cursor отримала апґрейд до версії 2.0 і нову ШІ-модель Composer
По темi
Вайбкодинг платформа Cursor отримала апґрейд до версії 2.0 і нову ШІ-модель Composer
Головний науковець із ШІ в Meta вважає LLM тупиковою гілкою розвитку технології яка не приведе до AGI
Головний науковець із ШІ в Meta вважає LLM тупиковою гілкою розвитку технології, яка не приведе до AGI
По темi
Головний науковець із ШІ в Meta вважає LLM тупиковою гілкою розвитку технології, яка не приведе до AGI
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Головоломка киянина Quadline перемогла на фестивалі інді-ігор Google Play
Головоломка киянина Quadline перемогла на фестивалі інді-ігор Google Play
Головоломка киянина Quadline перемогла на фестивалі інді-ігор Google Play
Харківська художниця намалювала новий дудл для Google на День Незалежності України
Харківська художниця намалювала новий дудл для Google на День Незалежності України
Харківська художниця намалювала новий дудл для Google на День Незалежності України
Фахівців Google тепер годуватимуть роботи. Вони також уміють давати корисні (і не дуже) поради
Фахівців Google тепер годуватимуть роботи. Вони також уміють давати корисні (і не дуже) поради
Фахівців Google тепер годуватимуть роботи. Вони також уміють давати корисні (і не дуже) поради

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.