Python Machine Learning
Картинка анонса

Машинное обучение. Опыт использования классификатора библиотеки Python Xgboost

Добрый день!
В сегодняшней статье хочу поделиться опытом использования xgboost/sklearn для задачи определения потенциально мошеннических операций, совершаемых клиентами кредитной организации.

Python Machine Learning
Картинка анонса

Машинное обучение. Опыт использования классификатора библиотеки Python Xgboost

Добрый день!
В сегодняшней статье хочу поделиться опытом использования xgboost/sklearn для задачи определения потенциально мошеннических операций, совершаемых клиентами кредитной организации.

Sklearn Machine Learning
Картинка анонса

Выбираем метод для поиска схожих операций

ML – панацея для любых задач или способ определить лучшие подходы для реализации? В своей статье я проведу сравнение различных по своей сути моделей кластеризации и простого метода расчета расстояния между точками при решении прикладной задачи поиска схожих операций.

Sklearn Machine Learning
Картинка анонса

Категориальные признаки в машинном обучении

Многие методы машинного обучения накладывают ограничение на типы признаков – все они должны быть числовыми. Но как быть, если ваши данные содержат текстовые категории, например, город, тип продукта, вид транзакций и т.п.? Ответ один – закодировать их числами!

Sklearn Machine Learning
Картинка анонса

Сравнение текста с помощью статистической меры TF-IDF

На сегодняшний день существует множество программ для сравнения текста или поиска совпадений текста, будь то сообщение на форуме, курсовая, рецепты, дипломные работы и так далее.
Так как эта тема вездесуща, то рассмотрим алгоритм некоторых таких программ и то, как они сравнивают текст.

Sklearn Machine Learning
Картинка анонса

Как в лесу найти мошенников (Random Forest)?

Если есть подозрительные транзакции по картам, то на их основе можно предсказывать заведомо мошеннические операции при последующих попытках. Насколько эффективно с этим справится метод ML Random Forest и какие метрики оценки модели лучше использовать на НЕ сбалансированных данных?

Sklearn Machine Learning
Картинка анонса

GridSearchCV. Поиск лучших параметров модели

Подбор параметров – одна из важных задач для построения модели машинного обучения. Изменение параметров модели может принципиально повлиять на ее качество.

Sklearn Machine Learning
Картинка анонса

Машинное обучение: с чего начать или как построить первую модель

Никогда не задумывался, что влияет на цену недвижимости?Рассказываем, как построили первую модель машинного обучения и проанализировали ее качество