Sklearn Pandas
Картинка анонса

Методы Pandas и Scikit-learn для подготовки данных

При подготовке структурированных данных использование языка программирования Python и в частности применение методов библиотек Pandas и Scikit-learn – это один из способов успешного решения такой задачи для Data Science специалиста.

Sklearn Pandas
Картинка анонса

Методы Pandas и Scikit-learn для подготовки данных

При подготовке структурированных данных использование языка программирования Python и в частности применение методов библиотек Pandas и Scikit-learn – это один из способов успешного решения такой задачи для Data Science специалиста.

Pandas Machine Learning
Картинка анонса

Полиномиальная регрессия и метрики качества модели

Применение линейной регрессии “из коробки” – задача нетривиальная. Но важно понимать метрики качества модели, а также то, что задача не всегда может сводится к стандартной линейной функции.

Python Machine Learning
Картинка анонса

Машинное обучение. Опыт использования классификатора библиотеки Python Xgboost

Добрый день!
В сегодняшней статье хочу поделиться опытом использования xgboost/sklearn для задачи определения потенциально мошеннических операций, совершаемых клиентами кредитной организации.

Sklearn Machine Learning
Картинка анонса

Выбираем метод для поиска схожих операций

ML – панацея для любых задач или способ определить лучшие подходы для реализации? В своей статье я проведу сравнение различных по своей сути моделей кластеризации и простого метода расчета расстояния между точками при решении прикладной задачи поиска схожих операций.

Sklearn Machine Learning
Картинка анонса

Категориальные признаки в машинном обучении

Многие методы машинного обучения накладывают ограничение на типы признаков – все они должны быть числовыми. Но как быть, если ваши данные содержат текстовые категории, например, город, тип продукта, вид транзакций и т.п.? Ответ один – закодировать их числами!

Sklearn Machine Learning
Картинка анонса

Сравнение текста с помощью статистической меры TF-IDF

На сегодняшний день существует множество программ для сравнения текста или поиска совпадений текста, будь то сообщение на форуме, курсовая, рецепты, дипломные работы и так далее.
Так как эта тема вездесуща, то рассмотрим алгоритм некоторых таких программ и то, как они сравнивают текст.

Sklearn Machine Learning
Картинка анонса

Как в лесу найти мошенников (Random Forest)?

Если есть подозрительные транзакции по картам, то на их основе можно предсказывать заведомо мошеннические операции при последующих попытках. Насколько эффективно с этим справится метод ML Random Forest и какие метрики оценки модели лучше использовать на НЕ сбалансированных данных?

Загрузить ещё