Превью для статьи

Распознавание лиц с помощью микросервиса с использованием Python библиотек OpenCV и Flask

В данной публикации рассмотрим создание микросервисного приложения для распознавания лиц и подсчет их количества с помощью таких инструментов, как библиотека OpenCV и Flask для Python и Postman для тестирования запросов

Превью для статьи

Разобраться с типами файлов

Отсутствие организованного хранения загруженных файлов может существенно осложнить понимание того, какие типы данных и в каком объеме у вас накоплены, а также увеличить время на классификацию форматов и их упорядочивание. Предлагаю вашему вниманию свой опыт создания автоматизированного метода сортировки файлов по типам

Превью для статьи

Продолжаем осваивать PySpark. Предобработка текста для машинного обучения

Рассмотрим базовые методы предобработки данных для моделей машинного обучения: научимся токенизировать текст и разберем нестареющую классику — TF-IDF, Word2Vec и CountVectorizer.

Превью для статьи

Работа с docx c помощью bayoo-docx

Нужно найти в docx-файле определенный фрагмент и оставить к нему комментарий? bayoo-docx (форк python-docx) умеет это! В конце статьи в виде бонуса расскажем, как определить номер страницы. 😊

Превью для статьи

Инструмент Flask. Создание простого веб-интерфейса под конкретные задачи

Знакомство с инструментом Flask. Основные преимущества и методы работы

Превью для статьи

Инструменты для решения NER-задач для русского языка

В нашей деятельности довольно часто приходится работать с большими объемами документов, к примеру, исполнительными листами, заявлениями, договорами, из текстов которых нам зачастую необходимо извлечь весьма конкретную информацию: ФИО, даты рождения, наименования должности, паспортные данные, адрес, ИНН и наименование компаний, даты подписания документов и так далее. Всё это относится к задаче распознавания именованных сущностей (NER). Так какие инструменты могут помочь нам в решении данной задачи для русского языка?

Превью для статьи

Перевод любых PDF-документов в текст: с распознаванием текста на изображениях и без

В ходе исследовательских проектов с применением NLP-моделей возникает необходимость извлечь текст из всех доступных видов файлов.

Data News

13-14 марта 2023


📍DevOpsConf