Дмитро Бунецький Научпоп 17 сентября 2022, 11:21

Роботам рано управлять дорожным движением: они не видят лес за деревьями

Глубокие сверточные нейронные сети (DCNN) не видят объекты так, как это видят люди с помощью конфигурационного восприятия формы. И это создает опасность для реальных программ искусственного интеллекта, доказывает профессор Джеймс Элдер из Йоркского университета.

Оставить комментарий

Роботам рано управлять дорожным движением: они не видят лес за деревьями

Глубокие сверточные нейронные сети (DCNN) не видят объекты так, как это видят люди с помощью конфигурационного восприятия формы. И это создает опасность для реальных программ искусственного интеллекта, доказывает профессор Джеймс Элдер из Йоркского университета.

Совместное исследование Элдера, возглавляющего в Йорке кафедру исследований человеческого и компьютерного зрения, и профессора психологии Николаса Бейкера из Лойола-колледжа в Чикаго, было публиковано в журнале Cell Press iScience под названием «Модели глубокого обучения не в состоянии уловить конфигураций человека».

Смотрите, в чем суть. Все объекты обладают локальными и конфигурационными свойствами формы. Локальное свойство — это некий кусок, за которым мы можем распознать целое.

Скажем, у кроликов есть характерные уши — это их четкое локальное свойство.

Вы мои уши не трогайте, смотрите на свои локальные свойства

Конфигурационное свойство формы — это пространственная связь всех кусков в единое целое. Логическая связь. Если у кролика уши вместо лап, может это вообще тюлень?

Человек достаточно быстро понимает, когда видит что-то реально странное. А как с этим у нейросетей?

Снятся ли нейросетям Франкенштейны

Чтобы провести исследования, ученые создали новые визуальные стимулы — их назвали «Франкенштейны» — чтобы исследовать, как человеческий мозг и DCNN обрабатывают цельные конфигурационные свойства объектов.

«Франкенштейны — это объекты, которые были разобраны и собраны не так, как нужно, — говорит Элдер. — Как результат, у них есть все правильные локальные особенности, но в неправильных местах».

Когда люди видят «Франкенштейна», они «спотыкаются», понимая: что-то не так. DCNN четко дают ответ, что это за объект, проявляя нечувствительность к конфигурационным свойствам объектов. Если очень грубо, нейросети «считают», что объект — это совокупность его свойств, и не очень важно, в каком порядке они соединены.

Вот в чем проблема: ученые перемешивали части целого, но робот все равно воспринимал это как целое.

«Наши результаты объясняют, почему глубокие модели искусственного интеллекта дают сбой при определенных условиях, — говорит Элдер. — Глубокие модели, как правило, используют ярлыки при решении сложных задач распознавания. Хотя эти ярлыки могут работать во многих случаях, они могут быть опасны в некоторых реальных программах искусственного интеллекта, над которыми мы сейчас работаем с нашими отраслевыми и государственными партнерами», — отмечает Элдер.

Одно из таких применений — это системы видеонаблюдения за дорожным движением.

«Объекты на сцене оживленного дорожного движения — транспортные средства, велосипеды и пешеходы — мешают друг другу и попадаются на глаза водителю как куча разобщенных фрагментов, — объясняет Элдер. — Мозг должен правильно сгруппировать эти фрагменты, чтобы определить правильную категорию и расположение объектов. Система искусственного интеллекта для мониторинга безопасности дорожного движения, способная воспринимать только отдельные фрагменты, не справится с этой задачей, потенциально неправильно понимая риски для уязвимых участников дорожного движения».

Копирование мозга не помогло

Причем вот что интересно: сделать модель более похожей на мозг — не помогло.

«Архитектура стандартных DCNN гораздо проще, чем у зрительной коры. Обработка прямой, систематически проходя от мелких до грубых масштабов, с глобальными взаимодействиями, ограниченными конечными слоями. Напротив, зрительная кора имеет массивные повторяющиеся и пропускающие связи, имеющие потенциал для объединения глобальной и локальной информации на ранних стадиях обработки, что может иметь решающее значение для восприятия конфигурации», — говорится в исследовании.

Поскольку данные нейрологических исследований свидетельствуют о том, что повторяющиеся связи в зрительной коре важны для распознавания объектов и для захвата долгосрочных пространственных зависимостей, лежащих в основе конфигурационного восприятия, ученые решили повторить эксперимент на CORnet, периодической DCNN, вдохновленной архитектурой вентрального потока.

А откуда вы знаете, как у нас, приматов, устроен мозг?

Сеть состоит из четырех слоев, примерно соответствующих зонам вентрального потока V1, V2, V4 и IT зрительной коры приматов. В отличие от стандартных DCNN с прямой связью, CORnet включает повторяющиеся соединения, возвращающие выход каждого уровня обратно на его вход несколько раз перед тем, как перейти к следующему уровню.

Но CORnet не сравнился с человеком и был слабее некоторых других сетей.

«Обработка объектов в коре головного мозга приматов, вероятно, поддерживает не только распознавание класса объекта, но и разнообразные физические суждения об объекте, включая его 3D-местонахождение и ориентацию относительно наблюдателя и объектов вокруг него, его 3D -форму и размер и его физическое состояние (например, целое или фрагментированное). Такого рода пространственные задачи, скорее всего, не так-то легко решить путем суммирования локальных особенностей», — объясняют это исследователи.

То есть может копирование мозга и работает — просто нужно копировать больше мозга.

Ученые рассказали как правильно спать, чтобы сохранить сердце и мозг здоровыми

Как нейросети видят свободную и независимую Украину? Тест dev.ua

Читайте главные IT-новости страны в нашем Telegram

Оставить комментарий

Текст: Дмитро Бунецький Теги: нейромережі, робот, дослідження

Нашли ошибку в тексте — выделите её и нажмите Ctrl+Enter. Нашли ошибку в тексте — выделите её и нажмите кнопку «Сообщить об ошибке».

УЧАСТЬ В АЗАРТНИХ ІГРАХ МОЖЕ ВИКЛИКАТИ ІГРОВУ ЗАЛЕЖНІСТЬ. ДОТРИМУЙТЕСЯ ПРАВИЛ (ПРИНЦИПІВ) ВІДПОВІДАЛЬНОЇ ГРИ.

Ліцензія видана ТОВ "СЛОТС Ю.ЕЙ." на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 15.09.23 (рішення КРАІЛ №245 від 31.08.2023); ТОВ "СЛОТС Ю.ЕЙ." – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 26.04.2021 (рішення КРАІЛ №150 від 12.04.2021); ТОВ «СПЕЙСИКС» – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 08.02.2021 (рішення КРАІЛ №34 від 02.02.2021); ТОВ «ГЕЙМДЕВ» – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 16.02.2021 (рішення № 47 від 10.02.2021).

Розміщення реклами

Размещение рекламы

Германия передаст Украине 14 наземных беспилотников THeMIS. Что это за машины и как они работают

Німеччина передасть Україні 14 наземних безпілотників THeMIS. Імовірно, 7 таких транспортних засобів прибудуть до України до кінця цього року, вони призначені для евакуації поранених. Інші очікуються у 2023 році — їх будуть використовувати для очищення доріг. Нагадуємо, що це за зброя і що вона вміє.

Репост новостей заставляет нас считать себя умнее, но это не так. С лидерами мнений тоже работает, показывает новое исследование

Обмен новостными статьями с друзьями и подписчиками в социальных сетях побуждает людей полагать, что они знают о темах этих статей больше, чем они знают на самом деле. И это работает с активными пользователями Facebook, что ставит под вопрос осведомленность ваших любимых лидеров мнений. Об этом свидетельствует исследование ученых из Техасского университета в Остине. Кстати, обязательно покажите статью своим друзьям и репостните в соцсетях.

За десять лет айтишниц в Украине стало втрое больше, — исследование Global Logic

«Нова пошта» хочет делать роботов для ГСЧС: зачем это нужно

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Комментариев пока нет.

Войдите, чтобы оставить комментарий