Python Computer vision
Картинка анонса

Самостоятельная разметка данных для распознавания русского рукописного текста

В данной статье я опишу наш опыт создания датасета для обучения модели распознавания рукописного текста.
Предварительный анализ работ по этой теме показал, что в публичном доступе отсутствуют размеченные наборы данных на русском языке. Доступные данные либо описывают английский текст, либо не доступны для коммерческого использования. Нам не подходило такое условие, поэтому единственным вариантом стало создание собственных данных.

Python Computer vision
Картинка анонса

Самостоятельная разметка данных для распознавания русского рукописного текста

В данной статье я опишу наш опыт создания датасета для обучения модели распознавания рукописного текста.
Предварительный анализ работ по этой теме показал, что в публичном доступе отсутствуют размеченные наборы данных на русском языке. Доступные данные либо описывают английский текст, либо не доступны для коммерческого использования. Нам не подходило такое условие, поэтому единственным вариантом стало создание собственных данных.

Нейронные сети Machine Learning
Картинка анонса

Использование OpenCV(CV2) и PyTesseract для автоматизации процесса распознавания некачественных и/или неровных сканов PDF. Реализация поиска по ключевым словам

Рассмотрим задачу, есть папка с кучей файлов PDF, а требуется определенная информация из этих документов, да еще и в текстовом виде в одном документе…
Поделись своими идеями в комментариях к статье