Computer vision, Machine Learning

Кошечки против собак. «Мимишечный» DS

Время прочтения: 3 мин.

На данный момент в  области искусственного интеллекта уже изобретено очень много. Все это кем- то запрограммировано и выложено в общий доступ. Но применяли все это только программисты, пока не появился …

Orange  — это уникальный проект, позволяющий использовать все передовые методы ИИ в режиме конструктора. И даже глубинное обучение.

В работе аудитора уже сейчас возникает множество неструктурированных данных, на основе которых нужно проводить проверки. Ну вот, к примеру, сканы документов – как определить есть ли печать на документе? Или другая задача — присутствует ли в пакете документов какой-то определенный тип документа? А между тем, для этих целей, люди уже натренировали очень глубокие нейронные сети, которые различают тысячи разных предметов на картинках. Их мы и будем использовать.

Нужно переходить от слов к делу – научим машину отличать кошечек от собачек.

  1. На сайте для соревнований по машинному обучению скачаем архив с большим количеством изображений кошек и собак 2.
  2. Скачаем и установим Orange с официального сайта
  3. Запускаем Orange и устанавливаем плагин «Image Analytics»

4.Импортируем подготовленные изображения – я взял 500 фото кошечек  и столько же собачек

5. Обрабатываем каждое изображение любой из предлагаемых, уже натренированных сообществом, нейронных сетей. Я же возьму самую простую и быструю сеть SqueezeNet. Она переведет наши картинки в числовые данные.

6. Выделим 50 случайных картинок – тестовая выборка, на которых будем проверять качество

7. Далее будем использовать модель, которая выявит, какие признаки должны быть, чтобы отнести фотографию к тому или иному классу. Сделаем самую простую нейронную сеть из нескольких нейронов

8. Посмотрим на результат предсказания, и найдем допущенную ошибку

Из 50 изображений нейросеть ошиблась лишь единожды – очень неплохо для самой простой модели! В арсенале Orange еще много методов, которые могут помочь аудитору.

Напоследок, покажем результат работы алгоритма T-SNE, который визуализирует структуру данных.

Спасибо за проявленный интерес — это лучшая награда для автора.

Советуем почитать