Превью для статьи

Применение простых Автоэнкодерных архитектур в задачах поиска аномалий при максимально несбалансированных данных

В посте хочу поделиться способом решения задач классификации, а именно поиска аномалий, при помощи неприспособленного, на первый взгляд, для этого инструмента — автоэнкодера.

Превью для статьи

Библиотека PyOD: сравниваем алгоритмы поиска выбросов

Предлагаем рассмотреть несколько алгоритмов поиска выбросов, проведём первичное сравнение на различных датасетах и определим несколько наиболее оптимальных из них.

Превью для статьи

Машинное обучение для поиска аномалий

Поиск аномалий и выявление подозрительных операций широко применяется в клиентской аналитике, банковском аудите и других видах бизнес аналитики. Суть данной методики заключается в анализе больших объемов данных и выявлении поставщиков, клиентов, транзакций или иных активностей с крайне нетипичным поведением. Часто, такие аномалии являются индикатором мошенничества или поводом для более детального анализа подобных бизнес активностей.

Превью для статьи

Ансамбли методов в алгоритмах поиска выбросов

Большинство кейсов по поиску аномалий сводятся к задаче определения выбросов в данных методом k-ближайших соседей или локального уровня выбросов (LOF). Автор этого поста рассказал, как улучшить точность работы таких методов, применяя ансамбли.

Превью для статьи

Использование алгоритма COPOD для поиска аномалий в аудите

С каждым годом data driven подход становится все более популярным. Объем данных увеличивается вместе с потребностью извлечения полезной информации из бесконечного потока данных. Передовые компании мира все чаще используют машинное обучение для обнаружения инсайтов и аномалий в больших данных. Хочу поделиться опытом использования алгоритма COPOD в рамках аудита интеллектуального управления электропитанием устройств предприятия. Целью поставленной […]

Превью для статьи

Обнаружение новизны изображений с помощью Python и библиотеки scikit-learn

В статье расскажу, как с помощью библиотек scikit-learn, opencv, numpy, imutilsс выявить новизну входных изображений. Многие программы требуют наличия возможности решить, принадлежит ли новый объект тому же распределению, что и существующие объекты (это промежуточный результат), или его следует рассматривать как новизну. Часто эта возможность используется для очистки реальных наборов данных.

Превью для статьи

Обнаружение выбросов в Machine Learning

Доброе утро, друзья, что такое выбросы? Как их обнаружить и что можно предпринять в их отношении перед построением модели? Об этом в нашей статье