Дмитро БунецькийНаучпоп
17 сентября 2022, 11:21
2022-09-17
Роботам рано управлять дорожным движением: они не видят лес за деревьями
Глубокие сверточные нейронные сети (DCNN) не видят объекты так, как это видят люди с помощью конфигурационного восприятия формы. И это создает опасность для реальных программ искусственного интеллекта, доказывает профессор Джеймс Элдер из Йоркского университета.
Глубокие сверточные нейронные сети (DCNN) не видят объекты так, как это видят люди с помощью конфигурационного восприятия формы. И это создает опасность для реальных программ искусственного интеллекта, доказывает профессор Джеймс Элдер из Йоркского университета.
Совместное исследование Элдера, возглавляющего в Йорке кафедру исследований человеческого и компьютерного зрения, и профессора психологии Николаса Бейкера из Лойола-колледжа в Чикаго, было публиковано в журнале Cell Press iScience под названием «Модели глубокого обучения не в состоянии уловить конфигураций человека».
Смотрите, в чем суть. Все объекты обладают локальными и конфигурационными свойствами формы. Локальное свойство — это некий кусок, за которым мы можем распознать целое.
Скажем, у кроликов есть характерные уши — это их четкое локальное свойство.
Вы мои уши не трогайте, смотрите на свои локальные свойства
Конфигурационное свойство формы — это пространственная связь всех кусков в единое целое. Логическая связь. Если у кролика уши вместо лап, может это вообще тюлень?
Человек достаточно быстро понимает, когда видит что-то реально странное. А как с этим у нейросетей?
Снятся ли нейросетям Франкенштейны
Чтобы провести исследования, ученые создали новые визуальные стимулы — их назвали «Франкенштейны» — чтобы исследовать, как человеческий мозг и DCNN обрабатывают цельные конфигурационные свойства объектов.
«Франкенштейны — это объекты, которые были разобраны и собраны не так, как нужно, — говорит Элдер. — Как результат, у них есть все правильные локальные особенности, но в неправильных местах».
Когда люди видят «Франкенштейна», они «спотыкаются», понимая: что-то не так. DCNN четко дают ответ, что это за объект, проявляя нечувствительность к конфигурационным свойствам объектов. Если очень грубо, нейросети «считают», что объект — это совокупность его свойств, и не очень важно, в каком порядке они соединены.
Вот в чем проблема: ученые перемешивали части целого, но робот все равно воспринимал это как целое.
«Наши результаты объясняют, почему глубокие модели искусственного интеллекта дают сбой при определенных условиях, — говорит Элдер. — Глубокие модели, как правило, используют ярлыки при решении сложных задач распознавания. Хотя эти ярлыки могут работать во многих случаях, они могут быть опасны в некоторых реальных программах искусственного интеллекта, над которыми мы сейчас работаем с нашими отраслевыми и государственными партнерами», — отмечает Элдер.
Одно из таких применений — это системы видеонаблюдения за дорожным движением.
«Объекты на сцене оживленного дорожного движения — транспортные средства, велосипеды и пешеходы — мешают друг другу и попадаются на глаза водителю как куча разобщенных фрагментов, — объясняет Элдер. — Мозг должен правильно сгруппировать эти фрагменты, чтобы определить правильную категорию и расположение объектов. Система искусственного интеллекта для мониторинга безопасности дорожного движения, способная воспринимать только отдельные фрагменты, не справится с этой задачей, потенциально неправильно понимая риски для уязвимых участников дорожного движения».
Копирование мозга не помогло
Причем вот что интересно: сделать модель более похожей на мозг — не помогло.
«Архитектура стандартных DCNN гораздо проще, чем у зрительной коры. Обработка прямой, систематически проходя от мелких до грубых масштабов, с глобальными взаимодействиями, ограниченными конечными слоями. Напротив, зрительная кора имеет массивные повторяющиеся и пропускающие связи, имеющие потенциал для объединения глобальной и локальной информации на ранних стадиях обработки, что может иметь решающее значение для восприятия конфигурации», — говорится в исследовании.
Поскольку данные нейрологических исследований свидетельствуют о том, что повторяющиеся связи в зрительной коре важны для распознавания объектов и для захвата долгосрочных пространственных зависимостей, лежащих в основе конфигурационного восприятия, ученые решили повторить эксперимент на CORnet, периодической DCNN, вдохновленной архитектурой вентрального потока.
А откуда вы знаете, как у нас, приматов, устроен мозг?
Сеть состоит из четырех слоев, примерно соответствующих зонам вентрального потока V1, V2, V4 и IT зрительной коры приматов. В отличие от стандартных DCNN с прямой связью, CORnet включает повторяющиеся соединения, возвращающие выход каждого уровня обратно на его вход несколько раз перед тем, как перейти к следующему уровню.
Но CORnet не сравнился с человеком и был слабее некоторых других сетей.
«Обработка объектов в коре головного мозга приматов, вероятно, поддерживает не только распознавание класса объекта, но и разнообразные физические суждения об объекте, включая его 3D-местонахождение и ориентацию относительно наблюдателя и объектов вокруг него, его 3D -форму и размер и его физическое состояние (например, целое или фрагментированное). Такого рода пространственные задачи, скорее всего, не так-то легко решить путем суммирования локальных особенностей», — объясняют это исследователи.
То есть может копирование мозга и работает — просто нужно копировать больше мозга.
Германия передаст Украине 14 наземных беспилотников THeMIS. Что это за машины и как они работают
Німеччина передасть Україні 14 наземних безпілотників THeMIS. Імовірно, 7 таких транспортних засобів прибудуть до України до кінця цього року, вони призначені для евакуації поранених. Інші очікуються у 2023 році — їх будуть використовувати для очищення доріг. Нагадуємо, що це за зброя і що вона вміє.
Репост новостей заставляет нас считать себя умнее, но это не так. С лидерами мнений тоже работает, показывает новое исследование
Обмен новостными статьями с друзьями и подписчиками в социальных сетях побуждает людей полагать, что они знают о темах этих статей больше, чем они знают на самом деле. И это работает с активными пользователями Facebook, что ставит под вопрос осведомленность ваших любимых лидеров мнений. Об этом свидетельствует исследование ученых из Техасского университета в Остине. Кстати, обязательно покажите статью своим друзьям и репостните в соцсетях.