Как разобраться с Computer Vision

Технологии компьютерного зрения помогают робомобилю отличить фонарный столб от оленя, а роботу-курьеру — не перепутать газон с тротуаром. 

Как разобраться с Computer Vision

Технологии компьютерного зрения помогают робомобилю отличить фонарный столб от оленя, а роботу-курьеру — не перепутать газон с тротуаром. 

Еще они позволяют распознать человека в толпе, модерировать контент в соцсетях, диагностировать болезнь по рентгеновскому снимку, отличить кота от собаки, а корги — от лабрадора. 

Специалистов по Computer Vision пока не так много, а спрос на них растет с каждым годом. Рассказываем, как изучить новую технологию, не выходя из дома.    

Компьютерное зрение (Computer Vision, CV) — это область искусственного интеллекта, связанная с анализом, классификацией и распознаванием изображений и видео. В основе CV-систем обычно лежат алгоритмы на базе машинного обучения — с их помощью они учатся отличать одни объекты от других, видеть паттерны и закономерности. Человек учится распознавать образы в процессе знакомства с окружающим миром — еще в детстве он запоминает, чем отличается кошка от собаки, а интерфейс Among Us — от интерфейса Minecraft. Компьютер «мыслит» иначе — чтобы научить систему распознавать образы, ей нужно «скормить» датасет с размеченными данными, который наглядно показывает отличия одного объекта от другого.

Разметка данных, кстати, целая наука — причем довольно трудоемкая. Обычно для этого нанимают фрилансеров, которые дистанционно маркируют видеоролики и изображения. Чем точнее разметка и чем больше данных, тем точнее будет работать система компьютерного зрения. При этом многое зависит от специфики — алгоритм, которые ориентируется в разных видах птиц, не поможет робомобилю распознать преграду на дороге. Хотя бывают интересные прецеденты. Например, в Японии алгоритм для распознавания выпечки стали использовать для диагностики рака. 

С каждым годом технология эволюционирует, но без глитчей пока не обходится: алгоритмы путают людей с животными, принимаютабстрактные паттерны за реальные объекты, а иногда не могут отличитьчерепаху от ружья. Задача специалистов по компьютерному зрению — свести к минимуму такие инциденты и научить алгоритмы уверенно ориентироваться в окружающем мире. Например, на производстве система сможет выявить бракованное изделие, в клинике поможет врачу отличить злокачественную опухоль от доброкачественной, а астрофизикам позволит быстрее классифицировать небесные тела.

Технология сама по себе нейтральна, но применять ее можно по-разному — например, некоторые государства используют ее для деанонимизации протестующих. Поэтому специалистам по ИИ рекомендуют изучать этику в сфере машинного обучения. Один из таких курсов мы специально включили в эту подборку.

Где изучать компьютерное зрение?

Бесплатные уроки по теме «Компьютерное зрение» от Udemy 

Восемь коротких уроков отлично подойдут для быстрого погружения в тему. Например, вы узнаете, как устроена навигация робомобилей, что такое метод Виолы — Джонса, как работают сверточные и генеративно-состязательные нейросети, а также познакомитесь с библиотекой OpenCV и поймете, как использовать ее для распознавания лиц.\

Подробнее

Глубокое обучение и компьютерное зрение от А до Я: OpenCV, SSD и GAN от Udemy

На курсе вы освоите базовые инструменты компьютерного зрения и сможете не только создать приложение для распознавания лиц и объектов, но также генерировать изображения с помощью GAN — генеративно-состязательных нейросетей.

Подробнее

Компьютерное зрение с OpenCV и Python от Udemy

Вы узнаете, как глубокое обучение помогает компьютерам распознавать образы, а также создадите сервисы для распознавания и отслеживания объектов. Для обучения пригодится знание Python, но самых базовых навыков будет достаточно. Кстати, приобретать дорогое ПО не придется — в процессе обучения вы будете использовать бесплатные инструменты с открытым кодом.

Подробнее

Нейронные сети и компьютерное зрение от Stepik

Курс составили эксперты Samsung AI Center, которые на практике применяют технологии компьютерного зрения. На программе вы построите свою первую нейронную сеть, а также изучите архитектуру и алгоритмы ее настройки. Авторы утверждают, что курс подойдет даже старшеклассникам, но если у вас нет опыта работы с системами машинного обучения, то на освоение материалов лучше заложить побольше времени.

Подробнее

Компьютерное зрение от Coursera

Курс от Московского физико-технического института разбирает прикладные задачи из различных областей дата-аналитики, включая анализ текста, информационный поиск, коллаборативную фильтрацию и рекомендательные системы, бизнес-аналитику и прогнозирование временных рядов. Большинство преподавателей — это бывшие или действующие сотрудники Яндекса.

Подробнее

Основы компьютерного зрения с Watson и OpenCV от edХ

На этом вводном курсе вы научитесь обрабатывать и классифицировать изображения, следуя гайдлайнам от сотрудников IBM, а также освоите базовые принципы работы с Python, Watson AI и OpenCV

Подробнее

Обработка изображений с помощью Python. Бесплатный курс от DataCamp

Отличное дополнение к курсу от edX — четыре модуля по обработке и маркировке изображений. Программа сфокусирована не столько на компьютерном зрении, сколько на обработке визуала (image processing). Например, вы научитесь улучшать качество медицинских снимков, увеличивать фотографии в несколько раз, удалять отдельные объекты и распознавать паттерны с помощью современных инструментов на базе машинного обучения.

Подробнее

Станьте экспертом по компьютерному зрению с Udacity

На занятиях вы научитесь работать с системами компьютерного зрения, которые уже применяются во многих отраслях — от производства до автотранспорта. Партнерами курса выступили Nvidia, Deep Learning Institute и компания Affectiva, которая создает ПО для распознавания эмоций по фото и видео. Плюс обучения на Udacity — это дополнительная помощь с трудоустройством после окончания курса. Вам помогут улучшить резюме и страницу на LinkedIn, а также организуют ревью кода на Github.

Подробнее

Специализация «Глубокое обучение» от Coursera

Фундаментальная программа, разработанная при участии известного эксперта по машинному обучению Эндрю Ына, включает пять курсов по глубокому обучению. Вы узнаете, какие технологии на самом деле скрываются за абстрактным понятием «искусственный интеллект», научитесь работать с разными типами нейросетей и сможете применять их для распознавания образов, синтеза речи и музыки. 

Подробнее

Специализация Ethics in the Age of AI от Coursera

Разработчики часто закладывают в алгоритмы собственные предубеждения и когнитивные искажения. В результате ИИ дискриминирует отдельные группы людей, совершает ошибки и вводит в заблуждение пользователей. Курс объясняет, что скрывает за «черный ящик» искусственного интеллекта и как предрассудки становятся частью «прошивки», а главное, объясняет разработчикам, как этого избежать.

Подробнее

В дополнение к курсам мы собрали пять книг по теме, которые уже переведены на русский язык

«Глубокое обучение. Погружение в мир нейронных сетей» С. И. Николенко, А. Кадурин, Е. В. Архангельская (2018)

Книга раскрывает историю глубокого обучения, его основные компоненты, а также современные достижения в этой области. Много объяснений, минимум кода и максимум пользы.

Читать

«Программирование компьютерного зрения на языке Python» Я. Э. Солем (2018)

В пособии подробно изложены основы теории и алгоритмов компьютерного зрения. Вы познакомитесь с различными методами распознавания объектов, трехмерной реконструкции, обработки стереоизображений, дополненной реальности и других сценариях применения компьютерного зрения. Книга предлагает упражнения, которые помогут проверить знания на практике. Недостаток — «хардкорный» стиль повествования. Как отмечает один из читателей: «Если у вас средний балл по высшей математике был менее 4,99, то понять что-либо в книге будет затруднительно».

Читать

«Обработка изображений с помощью OpenCV» Глория Буэно Гарсия (2016)

OpenCV — это широко распространенная библиотека компьютерного зрения. Она включает сотни готовых функций обработки изображений и используется как в сфере образования, так и в промышленности. Пособие дает базовое представление о библиотеке и сценариях ее применения. В книге подробно разобраны методы обработки изображений, например, ретуширование, очистка от шумов и создание HDR-изображений. Неплохой вариант для знакомства с OpenCV для новичка.

Читать

«Код креативности. Как искусственный интеллект учится писать, рисовать и думать» Маркус дю Сотой (2020)

azbooka.ru

Оксфордский профессор и популяризатор науки Маркус дю Сотой пытается понять, подвластно ли алгоритмам творчество. Можно ли с помощью ИИ генерировать произведения искусства и какой эмоциональный отклик они вызывают у читателя? Полезное чтение в эпоху, когда созданные нейросетями картины уже продаются на крупных аукционах.

Читать

«IT как оружие. Какие опасности таит в себе развитие высоких технологий» Брэд Смит, Кэрол Браун (2021)

telemetr.me

Краткий ликбез по проблемам этики в сфере высоких технологий от руководителей компании Microsoft. Авторы разбираются в вопросах приватности, кибербезопасности и автоматизации. Как отмечает одна из читательниц: «Отзыв на эту книгу можно начать с признания, что у меня прямо сейчас заклеена вебка на ноутбуке. Пока слушала [аудиокнигу], желания отклеить [стикер] не появилось».

Читать

Хочете повідомити важливу новину? Пишіть у Telegram-bot.

А також підписуйтесь на наш Telegram-канал.

Читайте также

От стриминга до менторства: 8 источников дополнительного дохода для разработчика
От стриминга до менторства: 8 источников дополнительного дохода для разработчика
От стриминга до менторства: 8 источников дополнительного дохода для разработчика
Не обязательно загружать себя заказами на фрилансе, чтобы увеличить доход. Программист может подзаработать и другими способами — например, кодить в прямом эфире или собирать донаты на Patreon. Мы изучили книгу фронтенд-разработчика и блогера Флорина Попа «10 способов заработка для разработчиков» и выбрали самые интересные источники дополнительного дохода. 
12 курсов по языку программирования R – от базовых до суперпродвинутых
12 курсов по языку программирования R – от базовых до суперпродвинутых
12 курсов по языку программирования R – от базовых до суперпродвинутых
Для статистической обработки данных и создания визуализаций используется функциональный язык R. Он помогает совершать научные открытия, получать маркетинговые инсайты и ориентироваться в хаосе big data. А еще с его помощью можно распознать самую депрессивную песню Radiohead и проанализировать комментарии на Reddit. dev.ua собрал 12 курсов, которые помогут освоить язык R как программистам, так и специалистам, далеким от ИТ.
Собираем роботов и паяем платы: 9 курсов по Arduino и Raspberry Pi
Собираем роботов и паяем платы: 9 курсов по Arduino и Raspberry Pi
Собираем роботов и паяем платы: 9 курсов по Arduino и Raspberry Pi
Мечтаете собрать метеорологическую станцию, квардрокоптер, смарт-колонку с жестовым управлением или роботизированного котенка? Это возможно сделать на базе Arduino и Raspberry Pi. Эти системы легли в основу многих популярных девайсов с Kickstarter и сделали железа более доступной. В сегодняшней подборке — 9 курсов по Arduino и Raspberry Pi, которые помогут быстро освоить принципы создания электроники.
10 курсов Golang + профессиональный блог
10 курсов Golang + профессиональный блог
10 курсов Golang + профессиональный блог
Go (Golang) стабильно попадает в рейтинг самых востребованных и быстрорастущих языков программирования во многих странах. Например, в Украине только за прошлый год число вакансий для программистов с Go выросло на 46%. Разработчики ценят язык за скорость и универсальность. Составили подборку курсов, вебинаров и бесплатных ресурсов по Go, которые помогут быстро освоить навык как новичкам, так и практикующим разработчикам.