Графы Анализ данных
Картинка анонса

Простой граф знаний на текстовых данных

Сегодня на простом примере рассмотрим – как провести краткий обзор неструктурированных данных в виде графа знаний.

Графы Анализ данных
Картинка анонса

Простой граф знаний на текстовых данных

Сегодня на простом примере рассмотрим – как провести краткий обзор неструктурированных данных в виде графа знаний.

Parsing / Сбор информации
Картинка анонса

Парсинг данных быстро и эффективно

Перед каждым DS специалистом встает вопрос поиска данных. Большинство сайтов не хотят отдавать вам информацию просто так, у них нет API или инструментов для выгрузки. Тогда перед вами встает вопрос, как же собрать данные?
Сегодня мы об этом расскажем.

Python Pandas
Картинка анонса

Борьба с несбалансированностью классов с помощью модуля NearMiss

При построении невероятностных моделей или рассмотрении задачи классификации с большим количеством классов возникает проблема дисбаланса классов. В этой статье мы расскажем об одном из методов устранения дисбаланса классов.

Обработка документов
Картинка анонса

Создание надстройки VSTO Word для формирования шаблонов документов. Часть 2

В каждом распоряжении всегда присутствуют дата, номер и название, но количество пунктов в тексте всегда отличается. В этой статье мы расскажем, как добавлять новые пункты одним нажатием с помощью надстройки VSTO.

Анализ данных SQL
Картинка анонса

SQL Server: выбираем столбцы из результата выполнения хранимой процедуры

В этой статье я поделюсь способом, который позволит получить только необходимые столбцы в результате выполнения хранимой процедуры.

Нейронные сети Python
Картинка анонса

Классификация изображений с помощью TensorFlow и Keras

Классифицировать десятки тысяч скриншотов документов по типу.
Когда стоит такая задача, никто не станет перебирать файлы вручную. В этой статье расскажу о своём опыте классификации изображений с использованием нейросети

Обработка документов Python
Картинка анонса

Чтение текстовых PDF файлов в Python

В работе мы часто сталкиваемся с материалами в формате текстовых PDF файлов. Сегодня поделимся с вами скриптом, который поможет преобразовать PDF формат. В нашем случае задача заключалась в том, чтобы найти ключевые объекты в содержимом файлов.

Загрузить ещё