«Чекаем чеки» или менее известные инструменты для OCR
Для того, чтобы машина могла получить данные из физических документов, применяются технологии оптического распознавания символов (OCR). Наиболее распространённым инструментом для OCR до развития нейронных сетей являлся движок tesseract. Помимо него являются популярными продукты компании ABBYY, например ABBYY FineReader. Однако существуют и другие инструменты OCR, о которых знают немногие. О них и расскажем в этом посте.