Наталя Хандусенко ШІ 17 березня 2025, 16:04

ШІ не вміє читати годинник: він може виконувати домашнє завдання і навіть передбачати структури білків, але для нього досі є проблемою визначити час

Дослідники з Единбурзького університету перевірили здатність семи відомих мультимодальних великих мовних моделей відповідати на питання, пов’язані з часом, на основі різних зображень годинників або календарів.

Залишити коментар

ШІ не вміє читати годинник: він може виконувати домашнє завдання і навіть передбачати структури білків, але для нього досі є проблемою визначити час

Дослідники з Единбурзького університету перевірили здатність семи відомих мультимодальних великих мовних моделей відповідати на питання, пов’язані з часом, на основі різних зображень годинників або календарів.

«Здатність інтерпретувати та міркувати про час на основі візуальних даних є критично важливою для багатьох реальних додатків — від планування подій до автономних систем. Попри досягнення в MLLM, більшість зосереджені на виявленні об'єктів, підписах до зображень або розумінні сцени, залишаючи часові висновки недостатньо вивченим», — говориться в дослідженні.

Команда протестувала:

GPT-4o і GPT-o1 від OpenAI;
Gemini 2.0 від Google DeepMind;
Claude 3.5 Sonnet від Anthropic;
Llama 3.2-11B-Vision-Instruct від Meta;
Qwen2-VL7B-Instruct від Alibaba;
MiniCPM-V-2.6 від ModelBest.

Моделям надали різні зображення аналогових годинників — хронометри з римськими цифрами, різними кольорами циферблатів і навіть без секундної стрілки, а також 10-річні зображення календаря, пише Gizmodo.

Щодо зображень годинника, дослідники запитували ШІ, котра година показана на годиннику на даному зображенні? Для зображень календаря дослідники ставили прості запитання, наприклад, який день тижня — Новий рік, а також складніші, наприклад, який 153-й день року?

«Читання аналогового годинника і розуміння календаря включають складні когнітивні кроки: вони вимагають тонкого візуального розпізнавання (наприклад, положення годинникової стрілки, розташування клітинок дня) і нетривіальних числових міркувань (наприклад, обчислення зсуву днів)», — пояснили дослідники.

Загалом, ШІ-системи показали не найкращі результати. Вони правильно зчитували час на аналогових годинниках менш ніж у 25% випадків. Вони мали проблеми з годинниками з римськими цифрами та стилізованими стрілками так само як і з годинниками без секундної стрілки, що вказує на те, що проблема може бути пов’язана з виявленням стрілок та інтерпретацією кутів на циферблаті годинника, вважають дослідники.

Gemini-2.0 від Google показав найвищий результат у завданні з годинником, а GPT-o1 був точним у завданні з календарем у 80% випадків — набагато кращий результат, ніж у конкурентів. Але навіть тоді найуспішніша MLLM у календарному завданні все одно помилялася близько 20% часу.

«Більшість людей вміють визначати час і користуватися календарем з раннього віку. Наші висновки вказують на значну прогалину в здатності ШІ виконувати те, що є базовими навичками для людей, — сказав Рохіт Саксена, співавтор дослідження. «Ці недоліки необхідно усунути, якщо ми хочемо успішно інтегрувати системи штучного інтелекту в чутливі до часу реальні програми, такі як планування, автоматизація та допоміжні технології».

Китайська Baidu представила безплатні нові ШІ-моделі EARNIE X1 та ERNIE 4.5 стверджуючи що друга відповідає DeepSeek R1 за ціною вдвічі нижчою

Microsoft випадково видалила застосунок Copilot зі свіжим оновленням Windows

Після 9 років Google Assistant відправляють на спочинок: користувачів переводять на Gemini

Читайте головні IT-новини країни в нашому Telegram

Залишити коментар

Текст: Наталя Хандусенко Фото: BBC Теги: ші, штучний інтелект, годинник, годинники

Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».

Розміщення реклами

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Штучний інтелект почав озвучувати фільми на MEGOGO

3 коментарі

Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

2 коментарі

«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого

Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Коментарів поки немає.

Увійдіть, щоб залишити коментар