🚀💳 Trustee Plus - більше ніж криптогаманець з європейською платіжною карткою. Спробуй 👉

ШІ не вміє читати годинник: він може виконувати домашнє завдання і навіть передбачати структури білків, але для нього досі є проблемою визначити час

Дослідники з Единбурзького університету перевірили здатність семи відомих мультимодальних великих мовних моделей відповідати на питання, пов’язані з часом, на основі різних зображень годинників або календарів.

Залишити коментар
ШІ не вміє читати годинник: він може виконувати домашнє завдання і навіть передбачати структури білків, але для нього досі є проблемою визначити час

Дослідники з Единбурзького університету перевірили здатність семи відомих мультимодальних великих мовних моделей відповідати на питання, пов’язані з часом, на основі різних зображень годинників або календарів.

«Здатність інтерпретувати та міркувати про час на основі візуальних даних є критично важливою для багатьох реальних додатків — від планування подій до автономних систем. Попри досягнення в MLLM, більшість зосереджені на виявленні об'єктів, підписах до зображень або розумінні сцени, залишаючи часові висновки недостатньо вивченим», — говориться в дослідженні. 

Команда протестувала:

  • GPT-4o і GPT-o1 від OpenAI;
  • Gemini 2.0 від Google DeepMind;
  • Claude 3.5 Sonnet від Anthropic;
  • Llama 3.2-11B-Vision-Instruct від Meta;
  • Qwen2-VL7B-Instruct від Alibaba;
  • MiniCPM-V-2.6 від ModelBest.

Моделям надали різні зображення аналогових годинників — хронометри з римськими цифрами, різними кольорами циферблатів і навіть без секундної стрілки, а також 10-річні зображення календаря, пише Gizmodo.

Щодо зображень годинника, дослідники запитували ШІ, котра година показана на годиннику на даному зображенні? Для зображень календаря дослідники ставили прості запитання, наприклад, який день тижня — Новий рік, а також складніші, наприклад, який 153-й день року?

«Читання аналогового годинника і розуміння календаря включають складні когнітивні кроки: вони вимагають тонкого візуального розпізнавання (наприклад, положення годинникової стрілки, розташування клітинок дня) і нетривіальних числових міркувань (наприклад, обчислення зсуву днів)», — пояснили дослідники.

Загалом, ШІ-системи показали не найкращі результати. Вони правильно зчитували час на аналогових годинниках менш ніж у 25% випадків. Вони мали проблеми з годинниками з римськими цифрами та стилізованими стрілками так само як і з годинниками без секундної стрілки, що вказує на те, що проблема може бути пов’язана з виявленням стрілок та інтерпретацією кутів на циферблаті годинника, вважають дослідники. 

Gemini-2.0 від Google показав найвищий результат у завданні з годинником, а GPT-o1 був точним у завданні з календарем у 80% випадків — набагато кращий результат, ніж у конкурентів. Але навіть тоді найуспішніша MLLM у календарному завданні все одно помилялася близько 20% часу.

«Більшість людей вміють визначати час і користуватися календарем з раннього віку. Наші висновки вказують на значну прогалину в здатності ШІ виконувати те, що є базовими навичками для людей, — сказав Рохіт Саксена, співавтор дослідження. «Ці недоліки необхідно усунути, якщо ми хочемо успішно інтегрувати системи штучного інтелекту в чутливі до часу реальні програми, такі як планування, автоматизація та допоміжні технології».

Китайська Baidu представила безплатні нові ШІ-моделі EARNIE X1 та ERNIE 4.5 стверджуючи що друга відповідає DeepSeek R1 за ціною вдвічі нижчою
Китайська Baidu представила безплатні нові ШІ-моделі EARNIE X1 та ERNIE 4.5, стверджуючи, що друга відповідає DeepSeek R1 за ціною вдвічі нижчою
По темi
Китайська Baidu представила безплатні нові ШІ-моделі EARNIE X1 та ERNIE 4.5, стверджуючи, що друга відповідає DeepSeek R1 за ціною вдвічі нижчою
Microsoft випадково видалила застосунок Copilot зі свіжим оновленням Windows
Microsoft випадково видалила застосунок Copilot зі свіжим оновленням Windows
По темi
Microsoft випадково видалила застосунок Copilot зі свіжим оновленням Windows
Після 9 років Google Assistant відправляють на спочинок: користувачів переводять на Gemini
Після 9 років Google Assistant відправляють на спочинок: користувачів переводять на Gemini
По темi
Після 9 років Google Assistant відправляють на спочинок: користувачів переводять на Gemini
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
1 коментар
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті. 

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.