Превью для статьи

Не ешь просрочку: Как Go и Tesseract помогают распознавать срок годности продуктов

Неправильное распознавание дат сроков годности может иметь серьезные последствия для потребителей. В случае употребления просроченной продукции возрастает риск пищевого отравления или иных заболеваний, связанных с употреблением испорченных продуктов. Кроме того, неправильное распознавание дат может привести к неоправданным финансовым потерям как для потребителей, так и для производителей, которые должны будут вывести просроченные продукты их оборота, но, могут ошибочно вывести из оборота и непросроченные продукты. В этом посте я исследую возможности распознавания срока годности с использованием языка программирования Go и Tesseract OCR.

Превью для статьи

Распознавание и перевод текста через телеграм-бота

Кажется, что сегодня алгоритмы машинного обучения применяются чуть ли не в каждом втором приложении. Хотя подождите, не кажется: в наше время и правда сложно найти более или менее серьезную компанию, продукты которой полностью обходятся без нейросетей — помощников… Существуют даже интеллектуальные приложения для заметок!

Превью для статьи

Краткий экскурс в ruGPT-3. Инструкция и демонстрация.

GPT-3 — нейронная сеть, наделавшая шума в 2020 году, как самая сложная, объёмная и многообещающая модель по работе с текстовыми данными. В октябре этого же года команды из SberDevices на основе статьи от OpenAI и кода модели GPT2 смогли разработать русскоязычный аналог под название ruGPT-3. За счет универсальности и гибкости модели ее можно использовать не только для создания текста, но и в десятках других сложных сценариев.

Превью для статьи

Быстрая разработка прототипа HTR системы на открытых данных

В данной статье представлен способ максимально быстро получить результат используя Google Colab в качестве платформы для обучения модели HTR.

Превью для статьи

FineReader, Tesseract и EasyOCR или нужно ли срочно менять инструмент для OCR

По сравнению со старшими товарищами, EasyOCR очень молодой проект, но с большими амбициями. В статье приводится сравнение качества работы, удобства работы, особенности установки и производительности трёх инструментов.

Превью для статьи

Использование OpenCV(CV2) и PyTesseract для автоматизации процесса распознавания некачественных и/или неровных сканов PDF. Реализация поиска по ключевым словам

Рассмотрим задачу, есть папка с кучей файлов PDF, а требуется определенная информация из этих документов, да еще и в текстовом виде в одном документе…
Поделись своими идеями в комментариях к статье

Превью для статьи

Поиск нарушений на видео с помощью компьютерного зрения

Автоматизация обработки видеозаписи с целью выявления нарушений — одно из востребованных направлений компьютерного зрения во многих отраслях.
Сегодня мы попытаемся обнаружить на видео отсутствие клиента в кадре в момент проведения операции в автоматизированной системе.