Саморазвитие

Вебинар NewTechAudit. Ответы на вопросы

Время прочтения: 3 мин.

Ответы на вопросы, которые были заданы во время вебинара

  1. Как распознаются лица близнецов?

Лица близнецов будут распознаваться как единый человек. Отличия ключевых точек настолько незначительны, поэтому при базовых инструментах распознавание будет выдавать одинаковый результат.

Приведу пример – двоих моих детей с разницей в полтора года даже сложные решения определяют как одного человека.

2. Каковы требования к харду?

По факту – чем выше, тем лучше. Для небольших и сложных проектов достаточно базового пк ( например процесор i5 – i7 ) и видеокарты с CUDA. Первоначальные тесты потокового распознавания делал на пк с i3 и без видеокарты, с использованием MTCNN на CPU

3. Можно ли распознать с помощью показанных инструментов не только лица, но и другие предметы. Например, автомобильные номера?

Каскад Хаара можно тренировать распознавать любые объекты. Так что для начала попробуйте разобраться с OpenCV

4. Я встречал визуализию, в которой ядро прикладывалось не центром к левой верхней ячейке, а своей верхней левой ячейкой. За счет этого размер выходной матрицы тоже уменьшался. Есть ли принципиальная разница между этими способами свертки?

Принципиальная разница есть. Это называется сдвигом, когда матрица ядра не проходит по каждому пикселю а сдвигается на определенный коэффициент. На выходе мы получим другой размер матрицы.

5. Евклидова метрика может долго вычисляться на разреженных векторах больших размерностей. Что предпочтительнее: понижать размерность или менять метрику? Если второе, на какую?

Предпочтительнее менять размерность + можно использовать кластеризацию при определении большого пула объектов.

6. Если нужно комплексное решение для создание (обновление) библиотеки людей, какой стек библиотек рекомендуете?

Для начала возьмите dlib. Если хочется больше разобраться в коде — facenet

7. Применяется ли метод Фурье к анализу изображений?

Проанализировав имеющуюся информацию, пришел к выводу что популярных реализаций с использованием этого метода применимого к распознаванию лиц нет. Так что сделаю вывод, что конкретно к нашей задаче он не применяется.

8. Еще вопрос по созданию библиотеки людей. Часто нужно вручную проверять правильность привязки/дектекции, что-то ручками перепривязывать. Т.е. если нужен некий UI. Что-то есть из open-source решений?

Из open-source я не встречал, скорее всего придется реализовывать самостоятельно. Промышленные решения имеют в себе данный функционал, но в данном вебинаре мы его не рассматривали.

9. Какое самое оптимальное разрешение фото лица для детекции и распознавания?

От 1024х768 и выше. Чем выше тем, лучше J

10. Подскажите, пожалуйста, как реагирует программа, например, если на человек одел кепку, очки, отрастил усы, чего у него раньше не было?

Для нейросетей это некритично. Отличия на выходе будут минимальные.

11. Был ли опыт обучения именно? Или пользовались предобученными сетами?

Конкретно для обучения распознавания лиц – нет. Предобученные сеты прекрасно справлялись с моими задачами, и нужны в дообучении не было. Одну из задач с обучениям решал в ходе определения пола по лицу.

Советуем почитать