Применение простых Автоэнкодерных архитектур в задачах поиска аномалий при максимально несбалансированных данных

Советуем почитать

Генерация паспортных данных для обучения моделей

Я знаю, что ты делал этой ночью

LLM'ы в преобразовании запроса на естественном языке в SQL (text2sql)

Ускоряем обучение с подкреплением на 50%

Доверительный интервал коэффициента Джини. Что это?

Создание персонажей в Python с помощью LLM: from GPT to Kandinsky

Data News

16-17 апреля 2024 года

XVI Национальная конференция ИВА «Внутренний аудит в России

26-27 июля 2024 года

PyCon Russia - конференция для python-разработчиков

Превью для статьи

22.03.2023, Абрамчук Илья г. Санкт-Петербург

Применение простых Автоэнкодерных архитектур в задачах поиска аномалий при максимально несбалансированных данных

В посте хочу поделиться способом решения задач классификации, а именно поиска аномалий, при помощи неприспособленного, на первый взгляд, для этого инструмента — автоэнкодера.

Machine learning and neural networks Другие технологии

Превью для статьи

06.10.2022, Лысенко Александра, г. Иркутск

Библиотека PyOD: сравниваем алгоритмы поиска выбросов

Предлагаем рассмотреть несколько алгоритмов поиска выбросов, проведём первичное сравнение на различных датасетах и определим несколько наиболее оптимальных из них.

Machine learning and neural networks Другие технологии

Превью для статьи

09.08.2022, Шохирев Алексей, г. Екатеринбург

Машинное обучение для поиска аномалий

Поиск аномалий и выявление подозрительных операций широко применяется в клиентской аналитике, банковском аудите и других видах бизнес аналитики. Суть данной методики заключается в анализе больших объемов данных и выявлении поставщиков, клиентов, транзакций или иных активностей с крайне нетипичным поведением. Часто, такие аномалии являются индикатором мошенничества или поводом для более детального анализа подобных бизнес активностей.

Machine learning and neural networks Другие технологии

Превью для статьи

04.08.2022, Ступин Алексей, г. Иркутск

Ансамбли методов в алгоритмах поиска выбросов

Большинство кейсов по поиску аномалий сводятся к задаче определения выбросов в данных методом k-ближайших соседей или локального уровня выбросов (LOF). Автор этого поста рассказал, как улучшить точность работы таких методов, применяя ансамбли.

Machine learning and neural networks Другие технологии

Превью для статьи

03.06.2022, Конев Ярослав, г. Екатеринбург

Использование алгоритма COPOD для поиска аномалий в аудите

С каждым годом data driven подход становится все более популярным. Объем данных увеличивается вместе с потребностью извлечения полезной информации из бесконечного потока данных. Передовые компании мира все чаще используют машинное обучение для обнаружения инсайтов и аномалий в больших данных. Хочу поделиться опытом использования алгоритма COPOD в рамках аудита интеллектуального управления электропитанием устройств предприятия. Целью поставленной […]

BI and visualization Другие технологии

Превью для статьи

24.02.2022, Мушта Вячеслав, г. Ростов-на-дону

Обнаружение новизны изображений с помощью Python и библиотеки scikit-learn

В статье расскажу, как с помощью библиотек scikit-learn, opencv, numpy, imutilsс выявить новизну входных изображений. Многие программы требуют наличия возможности решить, принадлежит ли новый объект тому же распределению, что и существующие объекты (это промежуточный результат), или его следует рассматривать как новизну. Часто эта возможность используется для очистки реальных наборов данных.

Machine learning and neural networks Другие технологии

Превью для статьи

18.05.2021, Самаркина Валерия, г. Нижний Новгород

Обнаружение выбросов в Machine Learning

Доброе утро, друзья, что такое выбросы? Как их обнаружить и что можно предпринять в их отношении перед построением модели? Об этом в нашей статье

Machine learning and neural networks Другие технологии