Поиск дубликатов изображений с использованием Computer Vision

Советуем почитать

Не ешь просрочку: Как Go и Tesseract помогают распознавать срок годности продуктов

Замена Paint в задачах разметки графических данных

Генерация синтетических изображений с использованием диффузионно-трансформерной модели (DiT)

Использование библиотеки Facerecognition и фреймворка Django для распознавания лиц в реальном времени

ML-подходы по поиску похожих изображений

YOLOv7 для определения поз людей на видео

Data News

16-17 апреля 2024 года

XVI Национальная конференция ИВА «Внутренний аудит в России

26-27 июля 2024 года

PyCon Russia - конференция для python-разработчиков

Превью для статьи

28.04.2021, Золотова Татьяна г. Санкт-Петербург

Поиск дубликатов изображений с использованием Computer Vision

Как найти дубликаты изображений среди нескольких тысяч файлов, если они представлены разных форматах? Делюсь опытом использования Computer Vision для поиска дубликатов изображений документов

Computer vision Технологии аудита

Превью для статьи

14.04.2021, Владислав Сотников, г. Воронеж

Использование OpenCV(CV2) и PyTesseract для автоматизации процесса распознавания некачественных и/или неровных сканов PDF. Реализация поиска по ключевым словам

Рассмотрим задачу, есть папка с кучей файлов PDF, а требуется определенная информация из этих документов, да еще и в текстовом виде в одном документе…
Поделись своими идеями в комментариях к статье

Computer vision Технологии аудита

Превью для статьи

20.01.2021, Владислав Сотников, г. Воронеж

Сравнение использования PyTesseract и PDF модулей и библиотек для распознавания сканов PDF

Что делать если вы столкнулись с некачественным сканом?

Computer vision Технологии аудита

Превью для статьи

14.10.2020, Загороднев Денис, г. Москва

Парсинг и аудит

Как немного упростить процесс извлечения и обработки данных разного формата с вебсайтов при помощи Python? Вам не досталось API? Нужно всего лишь иметь среду разработки, Python и pip

Web scraping и web разработка Другие технологии