Превью для статьи

Не ешь просрочку: Как Go и Tesseract помогают распознавать срок годности продуктов

Неправильное распознавание дат сроков годности может иметь серьезные последствия для потребителей. В случае употребления просроченной продукции возрастает риск пищевого отравления или иных заболеваний, связанных с употреблением испорченных продуктов. Кроме того, неправильное распознавание дат может привести к неоправданным финансовым потерям как для потребителей, так и для производителей, которые должны будут вывести просроченные продукты их оборота, но, могут ошибочно вывести из оборота и непросроченные продукты. В этом посте я исследую возможности распознавания срока годности с использованием языка программирования Go и Tesseract OCR.

Превью для статьи

Замена Paint в задачах разметки графических данных

Модели машинного обучения компьютерного зрения являются крайне актуальной задачей в современном мире, поскольку компьютерные системы, способные “видеть”, могут применяться во многих областях жизни. Одной из самых популярных областей применения моделей компьютерного зрения является распознавание объектов на изображениях и видео.

Превью для статьи

Генерация синтетических изображений с использованием диффузионно-трансформерной модели (DiT)

Нередко на практике, когда работаешь с алгоритмами машинного обучения, а в особенности с нейронными сетями, сталкиваешься с проблемой нехватки данных для нормального обучения модели или хотя бы получения более‑менее стабильного результата. Вот и мы оказались в подобной ситуации, решая задачу компьютерного зрения, связанную с анализом наличия нарушений в помещениях закрытого типа: нужных изображений оказалось недостаточно для качественной модели, аугментация нам не сильно помогла, а спарсить изображения из Интернета оказалось невозможно из‑за специфики данных.

Превью для статьи

Использование библиотеки Facerecognition и фреймворка Django для распознавания лиц в реальном времени

В этом посте рассмотрим, как использовать библиотеку Facerecognition для распознавания лиц на изображениях. Комбинируя ее с веб-фреймворком Django мы покажем этапы создания веб-приложения пропускной системы

Превью для статьи

ML-подходы по поиску похожих изображений

Компьютерное зрение (computer vision, CV) – активно развивающаяся научная область, связанная с анализом изображений и видео. В последнее время данному направлению уделяется большое внимание, так как CV позволяет решать множество задач, таких как: детекцию объектов, классификацию изображений, распознавание лиц и т.д., которые в свою очередь применяются в разных сферах жизни от мобильных приложений для наложения масок на лицо во время звонка до построения систем безопасности, поиска преступников и мошенников

Превью для статьи

YOLOv7 для определения поз людей на видео

В этом посте мы познакомимся с возможностями YOLOv7 для определения поз людей на видео, обсудим принцип работы алгоритма, разберёмся, чем принципиально отличается подход к детекции скелетов человека в модели YOLOv7 и других фреймворках.

Превью для статьи

Познакомимся с Mahotas?

В данной публикации я познакомлю вас с библиотекой Mahotas, которая позволяет обрабатывать изображения. Рассмотрим некоторые методы и функции работы с картинками.