UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉
Ігор Вишневський ШІ
25 листопада 2025, 13:55
2025-11-25
Новий ШІ-додаток NaviSense допомагає погано зрячим людям знаходити сторонні предмети й орієнтуватися у просторі. Як це працює
Новий ШІ-додаток на основі штучного інтелекту з назвою NaviSense допомагає користувачам із вадами зору швидше знаходити повсякденні предмети та ідентифікувати об'єкти в режимі реального часу без попередньо завантажених баз даних.
Новий ШІ-додаток на основі штучного інтелекту з назвою NaviSense допомагає користувачам із вадами зору швидше знаходити повсякденні предмети та ідентифікувати об'єкти в режимі реального часу без попередньо завантажених баз даних.
Про це пише Interesting Engineering, зазначаючи, що додаток підключається до зовнішніх LLM та VLM.
Додаток був розроблений дослідниками з Університету штату Пенсильванія на базі смартфонів і використовує штучний інтелект не тільки для ідентифікації об'єктів, а й для полегшення їх знаходження у просторі слабо зрячими користувачами за допомогою звукових та тактильних підказок.
Команда представила технологію на конференції ACM SIGACCESS ASSETS 25 у Денвері, де вона отримала одну з нагород.
NaviSense має на меті розв’язати давні проблеми з подібним програмним забезпеченням, адже багато сучасних інструментів для слабозорих людей покладаються на бібліотеки об'єктів, які необхідно попередньо завантажити.
Професор Віджайкрішнан Нараянан, який брав участь в розробці додатка, заявив, що це обмежує гнучкість таких технологічних рішень.
«Раніше моделі об’єктів потрібно було попередньо завантажити в пам’ять сервісу, щоб їх можна було розпізнати. Це дуже неефективно та дає користувачам набагато менше гнучкості під час використання цих інструментів», — сказав Нараянан.
Він сказав, що команда додатка звернулася до штучного інтелекту, щоб подолати це вузьке місце.
Додаток підключається до зовнішнього сервера, на якому працюють великі мовні моделі, що дає змогу NaviSense інтерпретувати голосові підказки, сканувати навколишнє середовище та ідентифікувати цілі, не покладаючись на статичні бази даних.
«Використовуючи VLM та LLM, NaviSense може розпізнавати об’єкти у своєму середовищі в режимі реального часу на основі голосових команд, без необхідності попереднього завантаження моделей об’єктів. Це важлива віха для цієї технології», — запевнив Нараянан.
NaviSense прослуховує усний запит користувача, шукає об’єкти в просторі та фільтрує нерелевантні. Коли системі потрібні уточнення, вона ставить додаткові запитання.
Окрім того, система відстежує рухи руки користувача, контролюючи рух телефону, а потім дає вказівки напрямку, які допомагають йому дістатися до об’єкта.
Команда протестувала NaviSense з 12 учасниками в контрольованому середовищі.
Зараз команда вчених удосконалює енергоспоживання та підвищує ефективність моделі.
«Ця технологія досить близька до комерційного випуску, і ми працюємо над тим, щоб зробити її ще доступнішою», — сказав Нараянан.
Тим часом команда дослідників зі США та Британії зібрала штучний нейрон, який поводиться майже як жива клітина мозку: копіює її імпульси й підлаштовується під нові сигнали. Це може стати основою для роботів, що краще відчувають і розуміють довколишній світ.
Харківські лікарі перемогли на IT Arena 2024 зі своєю AR-технологією eXtra Vision. Ось, як працює інструмент, за допомогою яким лікарі можуть наскрізь бачити пацієнта
Месенджер для обіймашок. Як український додаток Obimy виріс до 5 млн юзерів з початку війни
Архітектор Євген Залуцький та IT-компанія Empat 15 вересня 2020 року запустили додаток Obimy для спілкування між близькими та партнерами за допомогою «дотиків», емодзі та жестів.
CEO Obimy Євген Залуцький розповів AIN, як розвивався проєкт і як досягнув аудиторії більш ніж 5 млн користувачів. До початку повномасштабної війни в Україні застосунок налічував близько 20 000 користувачів.