ПроАудит
Warning: Invalid argument supplied for foreach() in /var/www/u0707117/data/www/newtechaudit.ru/wp-content/themes/nta2024(2)/single.php on line 319

Warning: Invalid argument supplied for foreach() in /var/www/u0707117/data/www/newtechaudit.ru/wp-content/themes/nta2024(2)/single.php on line 340

Warning: Invalid argument supplied for foreach() in /var/www/u0707117/data/www/newtechaudit.ru/wp-content/themes/nta2024(2)/single.php on line 362

Вебинар Face recognition. Обзор технологии и инструментов

Время прочтения: 3 мин.

Материалы вебинара (презентация)Скачать

Ответы на вопросы, которые были заданы во время вебинара

Как распознаются лица близнецов?

Роман Иов: Лица близнецов будут распознаваться как единый человек. Отличия ключевых точек настолько незначительны, поэтому при базовых инструментах распознавание будет выдавать одинаковый результат.

Приведу пример – двоих моих детей с разницей в полтора года даже сложные решения определяют как одного человека.

Каковы требования к харду?

Роман Иов: По факту – чем выше, тем лучше. Для небольших и сложных проектов достаточно базового пк ( например процесор i5 – i7 ) и видеокарты с CUDA. Первоначальные тесты потокового распознавания делал на пк с i3 и без видеокарты, с использованием MTCNN на CPU

Можно ли распознать с помощью показанных инструментов не только лица, но и другие предметы. Например, автомобильные номера?

Роман Иов: Каскад Хаара можно тренировать распознавать любые объекты. Так что для начала попробуйте разобраться с OpenCV

Есть визуализация, в которой ядро прикладывалось не центром к левой верхней ячейке, а своей верхней левой ячейкой. За счет этого размер выходной матрицы тоже уменьшался. Есть ли принципиальная разница между этими способами свертки?

Роман Иов: Принципиальная разница есть. Это называется сдвигом, когда матрица ядра не проходит по каждому пикселю а сдвигается на определенный коэффициент. На выходе мы получим другой размер матрицы.

Евклидова метрика может долго вычисляться на разреженных векторах больших размерностей. Что предпочтительнее: понижать размерность или менять метрику? На какую?

Роман Иов: Предпочтительнее менять размерность + можно использовать кластеризацию при определении большого пула объектов.

Если нужно комплексное решение для создание (обновление) библиотеки людей, какой стек библиотек предпочтительнее?

Роман Иов: Для начала возьмите dlib. Если хочется больше разобраться в коде — facenet

Применяется ли метод Фурье к анализу изображений?

Роман Иов: Проанализировав имеющуюся информацию, я пришел к выводу, что популярных реализаций с использованием этого метода применимого к распознаванию лиц нет. Так что сделаю вывод, что конкретно к нашей задаче он не применяется.

Часто нужно вручную проверять правильность привязки/дектекции, что-то вручную перепривязывать (т.е. нужен некий UI). Имеется ли open-source решение?

Роман Иов: Из open-source я не встречал, скорее всего придется реализовывать самостоятельно. Промышленные решения имеют в себе данный функционал, но в данном вебинаре мы его не рассматривали.

Какое самое оптимальное разрешение фото лица для детекции и распознавания?

Роман Иов: От 1024х768 и выше. Чем выше тем, лучше.

Как реагирует программа, например, если на человек одел кепку, очки, отрастил усы, чего у него раньше не было?

Роман Иов: Для нейросетей это некритично. Отличия на выходе будут минимальные.

Был ли опыт обучения модели или пользовались предобученными сетами?

Роман Иов: Конкретно для обучения распознавания лиц – нет. Предобученные сеты прекрасно справлялись с моими задачами, и нужны в дообучении не было. Одну из задач с обучением я решал в ходе определения пола по лицу.

Вебинар Face recognition. Обзор технологии и инструментов

23.04.2020 Роман Иов, г. Иркутск