Превью для статьи

Не ешь просрочку: Как Go и Tesseract помогают распознавать срок годности продуктов

Неправильное распознавание дат сроков годности может иметь серьезные последствия для потребителей. В случае употребления просроченной продукции возрастает риск пищевого отравления или иных заболеваний, связанных с употреблением испорченных продуктов. Кроме того, неправильное распознавание дат может привести к неоправданным финансовым потерям как для потребителей, так и для производителей, которые должны будут вывести просроченные продукты их оборота, но, могут ошибочно вывести из оборота и непросроченные продукты. В этом посте я исследую возможности распознавания срока годности с использованием языка программирования Go и Tesseract OCR.

Превью для статьи

Решаем судоку при помощи компьютерного зрения

Поиграем в Судоку?

Превью для статьи

Перевод любых PDF-документов в текст: с распознаванием текста на изображениях и без

В ходе исследовательских проектов с применением NLP-моделей возникает необходимость извлечь текст из всех доступных видов файлов.

Превью для статьи

Быстрая разработка прототипа HTR системы на открытых данных

В данной статье представлен способ максимально быстро получить результат используя Google Colab в качестве платформы для обучения модели HTR.

Превью для статьи

FineReader, Tesseract и EasyOCR или нужно ли срочно менять инструмент для OCR

По сравнению со старшими товарищами, EasyOCR очень молодой проект, но с большими амбициями. В статье приводится сравнение качества работы, удобства работы, особенности установки и производительности трёх инструментов.

Превью для статьи

Анализ изображения с помощью фреймворка Easyocr

Easyosr — фреймворк для анализа текста с изображений с открытым кодом. За основу deep learning части данной библиотеки взята библиотека pytorch. Распознавательная часть данной библиотеки использует алгоритм craft, суть которого — обнаружение текстовой области и исследование каждой области символа, а также нахождения сходства между символами