Computer vision, Machine Learning, NLP

Вебинар Обзор инструментов Pytesseract, Dlib, TensorFlow и Yolov3 для анализа данных

Время прочтения: 2 мин.

Ответы на вопросы, которые были заданы во время вебинара.

  1. Насколько сильно качество распознавания текста зависит от качества изображения?  Что можно сделать для улучшения распознавания на сканах низкого качества?

Ответ: Качество изображения сильно влияет на качество распознавания текст. Зачастую для улучшения качества используют различные фильтры инструмента Opencv, либо фильтры на основе сверток, реализуются вручную, все зависит от проблемы.

2. Возможно ли найти лицо, направленное не на центр, используя аугментацию?

Ответ: Аугментация в данном случае не поможет. Если лицо направлено не точно по центру, но при этом видно все черты лица (оба глаза, брови, нос и губы), алгоритм должен сработать.

3. Датасет COCO можно использовать для тренировки?

Ответ: Вы не используете набор COCO, используются уже предобученные модели на данном наборе. Модели используются в качестве исследовательской деятельности, мы не создаем продукт в коммерческих целях.

4. Для чего могут понадобиться GANы в банках?

Ответ: Еще ни разу не встречались задачи с использованием генеративных моделей. По крайней мере, на моем опыте.

5. Назовите бесплатные ресурсы, обучающие программированию на Python?

Ответ: Из бесплатных -Stepik: Программирование на Python — Bioinformatics Institute, HackerRank — площадка для решения задач различной сложности.

6. Dlib написан на  C++?

Ответ: Да, написан на С++, c оболочкой для Python.

7. Для какого размера изображения указана скорость обработки на tensorflow?

Ответ: Изображения размером 600х600, Обработка осуществлялась на видеокарте GTX TITAN X

8. Курс Andrew Ng не на Python, а на Matlab?

Ответ: Проблемы, которые описывает Andrew Ng — простым языком объясняет методы по анализу данных. Все примеры я реализовывал в языке Python, таким образом я изучал язык программирования методом проб и ошибок. Я не проходил специализированные курсы по Python.

Советуем почитать