Наталя Хандусенко AI Eng 17 March 2025, 16:04

ШІ не вміє читати годинник: він може виконувати домашнє завдання і навіть передбачати структури білків, але для нього досі є проблемою визначити час

Дослідники з Единбурзького університету перевірили здатність семи відомих мультимодальних великих мовних моделей відповідати на питання, пов’язані з часом, на основі різних зображень годинників або календарів.

Leave a comment

ШІ не вміє читати годинник: він може виконувати домашнє завдання і навіть передбачати структури білків, але для нього досі є проблемою визначити час

Дослідники з Единбурзького університету перевірили здатність семи відомих мультимодальних великих мовних моделей відповідати на питання, пов’язані з часом, на основі різних зображень годинників або календарів.

«Здатність інтерпретувати та міркувати про час на основі візуальних даних є критично важливою для багатьох реальних додатків — від планування подій до автономних систем. Попри досягнення в MLLM, більшість зосереджені на виявленні об'єктів, підписах до зображень або розумінні сцени, залишаючи часові висновки недостатньо вивченим», — говориться в дослідженні.

Команда протестувала:

GPT-4o і GPT-o1 від OpenAI;
Gemini 2.0 від Google DeepMind;
Claude 3.5 Sonnet від Anthropic;
Llama 3.2-11B-Vision-Instruct від Meta;
Qwen2-VL7B-Instruct від Alibaba;
MiniCPM-V-2.6 від ModelBest.

Моделям надали різні зображення аналогових годинників — хронометри з римськими цифрами, різними кольорами циферблатів і навіть без секундної стрілки, а також 10-річні зображення календаря, пише Gizmodo.

Щодо зображень годинника, дослідники запитували ШІ, котра година показана на годиннику на даному зображенні? Для зображень календаря дослідники ставили прості запитання, наприклад, який день тижня — Новий рік, а також складніші, наприклад, який 153-й день року?

«Читання аналогового годинника і розуміння календаря включають складні когнітивні кроки: вони вимагають тонкого візуального розпізнавання (наприклад, положення годинникової стрілки, розташування клітинок дня) і нетривіальних числових міркувань (наприклад, обчислення зсуву днів)», — пояснили дослідники.

Загалом, ШІ-системи показали не найкращі результати. Вони правильно зчитували час на аналогових годинниках менш ніж у 25% випадків. Вони мали проблеми з годинниками з римськими цифрами та стилізованими стрілками так само як і з годинниками без секундної стрілки, що вказує на те, що проблема може бути пов’язана з виявленням стрілок та інтерпретацією кутів на циферблаті годинника, вважають дослідники.

Gemini-2.0 від Google показав найвищий результат у завданні з годинником, а GPT-o1 був точним у завданні з календарем у 80% випадків — набагато кращий результат, ніж у конкурентів. Але навіть тоді найуспішніша MLLM у календарному завданні все одно помилялася близько 20% часу.

«Більшість людей вміють визначати час і користуватися календарем з раннього віку. Наші висновки вказують на значну прогалину в здатності ШІ виконувати те, що є базовими навичками для людей, — сказав Рохіт Саксена, співавтор дослідження. «Ці недоліки необхідно усунути, якщо ми хочемо успішно інтегрувати системи штучного інтелекту в чутливі до часу реальні програми, такі як планування, автоматизація та допоміжні технології».

Китайська Baidu представила безплатні нові ШІ-моделі EARNIE X1 та ERNIE 4.5 стверджуючи що друга відповідає DeepSeek R1 за ціною вдвічі нижчою

Microsoft випадково видалила застосунок Copilot зі свіжим оновленням Windows

Після 9 років Google Assistant відправляють на спочинок: користувачів переводять на Gemini

Читайте головні IT-новини країни в нашому Telegram

Leave a comment

Text: Наталя Хандусенко Tags: ші, штучний інтелект, годинник, годинники

Found an error in the text? Highlight it and press Ctrl+Enter. Found an error in the text? Highlight it and press the 'Report an error' button.

Розміщення реклами

Advertising Placement

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Штучний інтелект почав озвучувати фільми на MEGOGO

3 comments

Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

2 comments

«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого

Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.

Have important news to share? Message our Telegram bot

Key events and useful links in our Telegram channel

No comments yet.

Sign in to leave a comment