UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉
Наталя ХандусенкоAI Eng
17 March 2025, 16:04
2025-03-17
ШІ не вміє читати годинник: він може виконувати домашнє завдання і навіть передбачати структури білків, але для нього досі є проблемою визначити час
Дослідники з Единбурзького університету перевірили здатність семи відомих мультимодальних великих мовних моделей відповідати на питання, пов’язані з часом, на основі різних зображень годинників або календарів.
Дослідники з Единбурзького університету перевірили здатність семи відомих мультимодальних великих мовних моделей відповідати на питання, пов’язані з часом, на основі різних зображень годинників або календарів.
«Здатність інтерпретувати та міркувати про час на основі візуальних даних є критично важливою для багатьох реальних додатків — від планування подій до автономних систем. Попри досягнення в MLLM, більшість зосереджені на виявленні об'єктів, підписах до зображень або розумінні сцени, залишаючи часові висновки недостатньо вивченим», — говориться в дослідженні.
Команда протестувала:
GPT-4o і GPT-o1 від OpenAI;
Gemini 2.0 від Google DeepMind;
Claude 3.5 Sonnet від Anthropic;
Llama 3.2-11B-Vision-Instruct від Meta;
Qwen2-VL7B-Instruct від Alibaba;
MiniCPM-V-2.6 від ModelBest.
Моделям надали різні зображення аналогових годинників — хронометри з римськими цифрами, різними кольорами циферблатів і навіть без секундної стрілки, а також 10-річні зображення календаря, пише Gizmodo.
Щодо зображень годинника, дослідники запитували ШІ, котра година показана на годиннику на даному зображенні? Для зображень календаря дослідники ставили прості запитання, наприклад, який день тижня — Новий рік, а також складніші, наприклад, який 153-й день року?
«Читання аналогового годинника і розуміння календаря включають складні когнітивні кроки: вони вимагають тонкого візуального розпізнавання (наприклад, положення годинникової стрілки, розташування клітинок дня) і нетривіальних числових міркувань (наприклад, обчислення зсуву днів)», — пояснили дослідники.
Загалом, ШІ-системи показали не найкращі результати. Вони правильно зчитували час на аналогових годинниках менш ніж у 25% випадків. Вони мали проблеми з годинниками з римськими цифрами та стилізованими стрілками так само як і з годинниками без секундної стрілки, що вказує на те, що проблема може бути пов’язана з виявленням стрілок та інтерпретацією кутів на циферблаті годинника, вважають дослідники.
Gemini-2.0 від Google показав найвищий результат у завданні з годинником, а GPT-o1 був точним у завданні з календарем у 80% випадків — набагато кращий результат, ніж у конкурентів. Але навіть тоді найуспішніша MLLM у календарному завданні все одно помилялася близько 20% часу.
«Більшість людей вміють визначати час і користуватися календарем з раннього віку. Наші висновки вказують на значну прогалину в здатності ШІ виконувати те, що є базовими навичками для людей, — сказав Рохіт Саксена, співавтор дослідження. «Ці недоліки необхідно усунути, якщо ми хочемо успішно інтегрувати системи штучного інтелекту в чутливі до часу реальні програми, такі як планування, автоматизація та допоміжні технології».
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.
Have important news to share? Message our Telegram bot
Key events and useful links in our Telegram channel