Ми запускаємо розсилку про українське IT-ком’юніті. Залиште email, аби розуміти більше. Прем’єра — скоро!
Дякую! На вказану адресу надіслано листа для підтвердження підписки.
Hot! dev.media шукає менеджера з продажу спецпроєктів

Роботів рано випускати керувати дорожнім рухом: вони не бачать лісу за деревами

Глибокі згорткові нейронні мережі (DCNN) не бачать об’єкти так, як це бачать люди, — за допомогою конфігураційного сприйняття форми. І це створює небезпеку для реальних програм штучного інтелекта, доводить професор Джеймс Елдер з Йоркського університету. 

Залишити коментар
Роботів рано випускати керувати дорожнім рухом: вони не бачать лісу за деревами

Глибокі згорткові нейронні мережі (DCNN) не бачать об’єкти так, як це бачать люди, — за допомогою конфігураційного сприйняття форми. І це створює небезпеку для реальних програм штучного інтелекта, доводить професор Джеймс Елдер з Йоркського університету. 

Спільне дослідження Елдера, який в Йорку очолює кафедру досліджень людського та комп’ютерного зору, та професора психології Ніколаса Бейкера з Лойола-коледжу в Чикаго, було публіковано в журналі Cell Press iScience під назвою «Моделі глибокого навчання не в змозі вловити конфігураційну природу сприйняття форми людини»

Дивіться, в чому суть. Усі об’єкти мають локальні та конфігураційні властивості форми. Локальна властивість — це якийсь шматок, за яким ми можемо розпізнати ціле. 

Скажімо, у кроликів є характерні вуха — це їх чітка локальна властивість. 

Ви мої вуха не чіпайте, йдіть на свої локальні властивості дивіться

Конфігураційна властивість форми — це просторовий зв’язок усіх шматків в єдине ціле. Логічний зв’язок. Якщо у кролика вуха замість лап, може, це взагалі тюлень? 

Людина досить швидко розуміє, коли бачить щось реально дивне. А як з цим у нейромереж?

Чи сняться нейромережам Франкенштейни

Щоб провести дослідження, вчені створили нові візуальні стимули — їх назвали «Франкенштейни» — щоб дослідити, як людський мозок і DCNN обробляють цілісні конфігураційні властивості об’єктів.

«Франкенштейни — це об’єкти, які були розібрані та зібрані не так, як треба, — каже Елдер. — Як результат, вони мають усі правильні локальні особливості, але в неправильних місцях». 

Коли люди бачать «Франкенштейна», вони «спотикаються», розуміючи: щось не так. Натомість, DCNN чітко дають відповідь, що це за об’єкт, виявляючи нечутливість до конфігураційних властивостей об’єктів. Якщо дуже грубо, нейромережі «вважають», що об’єкт — це сукупність його властивостей, і не дуже важливо, в якому порядку вони поєднані

Ось у чому проблема: вчені «перемішували» частини цілого, та робот все одно сприймав це як ціле

«Наші результати пояснюють, чому глибокі моделі штучного інтелекту дають збій за певних умов, — каже Елдер. — Глибокі моделі, як правило, використовують „ярлики“ під час вирішення складних завдань розпізнавання. Хоча ці ярлики можуть працювати в багатьох випадках, вони можуть бути небезпечними в деяких реальних програмах штучного інтелекту, над якими ми зараз працюємо з нашими галузевими та державними партнерами», — зазначає Елдер.

Одне з таких застосувань — це системи відеоспостереження за дорожнім рухом. 

«Об’єкти на сцені жвавого дорожнього руху — транспортні засоби, велосипеди та пішоходи — заважають один одному та потрапляють на очі водієві як купа роз’єднаних фрагментів, — пояснює Елдер. — Мозок повинен правильно згрупувати ці фрагменти, щоб визначити правильні категорії та розташування об’єктів. Система штучного інтелекту для моніторингу безпеки дорожнього руху, яка здатна сприймати лише окремі фрагменти, не впорається з цим завданням, потенційно неправильно розуміючи ризики для вразливих учасників дорожнього руху».

Копіювання мозку не допомогло

Причому, ось що цікаво: зробити модель більш схожою на мозок — не допомогло. 

«Архітектура стандартних DCNN набагато простіша, ніж у зорової кори. Обробка є прямою, систематично проходячи від дрібних до грубих масштабів, із глобальними взаємодіями, обмеженими кінцевими шарами. Навпаки, зорова кора має масивні повторювані та пропускаючі зв’язки, які мають потенціал для об’єднання глобальної та локальної інформації на ранніх стадіях обробки, що може мати вирішальне значення для конфігураційного сприйняття», — йдеться у дослідженні. 

Оскільки дані нейрологічних досліджень свідчать, що повторювані зв’язки в зоровій корі важливі для розпізнавання об’єктів і для захоплення довгострокових просторових залежностей, що лежать в основі конфігураційного сприйняття, вчені вирішили повторити експеримент на CORnet, періодичній DCNN, натхненній архітектурою вентрального потоку приматів.

А звідки це ви знаєте, як у нас, приматів, влаштований мозок? 

Мережа складається з чотирьох шарів, які приблизно відповідають зонам вентрального потоку V1, V2, V4 та IT зорової кори приматів. На відміну від стандартних DCNN з прямим зв’язком, CORnet включає повторювані з’єднання, які повертають вихід кожного рівня назад на його вхід кілька разів перед тим, як перейти до наступного рівня. 

Але CORnet не зрівнявся з людиною і був слабшим за деякі інші мережі. 

«Обробка об’єктів у корі головного мозку приматів, ймовірно, підтримує не лише розпізнавання класу об’єкта, але й різноманітні фізичні судження про об’єкт, включаючи його 3D-місцезнаходження та орієнтацію відносно спостерігача та об’єктів навколо нього, його 3D-форму та розмір, і його фізичний стан (наприклад, цілий або фрагментований). Такого роду просторові завдання, швидше за все, не так легко вирішити шляхом підсумовування локальних особливостей», — пояснюють це дослідники. 

Тобто, може копіювання мозку і працює — просто потрібно копіювати більше мозку. 

Учені розповіли як правильно спати щоб зберегти серце та мозок здоровими
Учені розповіли, як правильно спати, щоб зберегти серце та мозок здоровими
По темi
Учені розповіли, як правильно спати, щоб зберегти серце та мозок здоровими
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
По темi
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Айтішник розробив та створив болід власноруч.

Дивіться на каналі dev.ua тест-драйв спорткара.

Ми запускаємо розсилку про українське IT-ком’юніті. Залиште email, аби розуміти більше. Прем’єра — скоро!
Дякую! На вказану адресу надіслано листа для підтвердження підписки.
Читайте також
На озброєнні ЗСУ з'явилися роботи THEMIS для перевезення солдатів і зброї. Що це за машини та як вони працюють
На озброєнні ЗСУ з'явилися роботи THEMIS для перевезення солдатів і зброї. Що це за машини та як вони працюють
На озброєнні ЗСУ з'явилися роботи THEMIS для перевезення солдатів і зброї. Що це за машини та як вони працюють
Репост новин змушує нас вважати себе розумнішими, але це не так. З лідерами думок теж працює, показує нове дослідження
Репост новин змушує нас вважати себе розумнішими, але це не так. З лідерами думок теж працює, показує нове дослідження
Репост новин змушує нас вважати себе розумнішими, але це не так. З лідерами думок теж працює, показує нове дослідження
Обмін новинними статтями з друзями та підписниками в соціальних мережах спонукає людей думати, що вони знають про теми цих статей більше, ніж вони знають насправді. І це працює з активними користувачами Facebook, що ставить під сумнів обізнаність ваших улюблених лідерів думок. Про це свідчить дослідження вчених з Техаського університету в Остіні. До речі, обов’язково покажіть цю статтю своїм друзям і репостніть у соцмережах.
За десять років айтішниць в Україні стало втричі більше, — дослідження Global Logic
За десять років айтішниць в Україні стало втричі більше, — дослідження Global Logic
За десять років айтішниць в Україні стало втричі більше, — дослідження Global Logic
«Нова пошта» хоче робити роботів для ДСНС: навіщо це потрібно
«Нова пошта» хоче робити роботів для ДСНС: навіщо це потрібно
«Нова пошта» хоче робити роботів для ДСНС: навіщо це потрібно

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.