Превью для статьи

Библиотека PyOD: сравниваем алгоритмы поиска выбросов

Предлагаем рассмотреть несколько алгоритмов поиска выбросов, проведём первичное сравнение на различных датасетах и определим несколько наиболее оптимальных из них.

Превью для статьи

Ищем выбросы. Критерий Шовене

Поиск выбросов, аномалий. Эта тема актуальна если исследователь — аналитик хочет получить адекватные результаты и избежать эффекта GIGO ( garbage in, garbage out — «мусор на входе — мусор на выходе»). Рассмотрим один из способов выявления аномальных выбросов – критерий Шовене.

Превью для статьи

Как почистить данные, не удаляя лишние знаки

Рассмотрим кейс быстрой очистки данных с использованием токенайзера python-библиотеки Natasha.

Превью для статьи

Предсказания, гадания… FILL-MASK моделирование!

В различных отраслях, связанных с клиентским сервисом, задачи NLP не редкость: суммаризация, сентиментный анализ, рекомендательные сервисы. По ссылке ниже кейс моделирования с маскированием

Превью для статьи

Gluon Time Series – библиотека от Amazon для работы с временными рядами

Добрый день, друзья! Сегодня познакомлю вас библиотекой Gluon Time Series, которую используют для работы с временными рядами

Превью для статьи

Статистический анализ данных с помощью SKLEARN

В повседневной жизни можно столкнуться с вопросом взаимосвязи двух или нескольких параметров – какая вероятностная связь присутствует в тех или иных условиях. Расскажу о подготовке данных к статистическому анализу, разберу два способа анализа данных с помощью библиотеки машинного обучения sklearn.

Превью для статьи

Как в условиях недостатка данных улучшить качества классификатора

Исследователи сталкиваются с плохим качеством данных и/или их отсутствием? Рассмотрим способы улучшение метрик классификатора в условиях малого количества признаков.

Data News