Sklearn Machine Learning
Картинка анонса

Категориальные признаки в машинном обучении

Многие методы машинного обучения накладывают ограничение на типы признаков – все они должны быть числовыми. Но как быть, если ваши данные содержат текстовые категории, например, город, тип продукта, вид транзакций и т.п.? Ответ один – закодировать их числами!

Sklearn Machine Learning
Картинка анонса

Категориальные признаки в машинном обучении

Многие методы машинного обучения накладывают ограничение на типы признаков – все они должны быть числовыми. Но как быть, если ваши данные содержат текстовые категории, например, город, тип продукта, вид транзакций и т.п.? Ответ один – закодировать их числами!

Sklearn Machine Learning
Картинка анонса

Сравнение текста с помощью статистической меры TF-IDF

На сегодняшний день существует множество программ для сравнения текста или поиска совпадений текста, будь то сообщение на форуме, курсовая, рецепты, дипломные работы и так далее.
Так как эта тема вездесуща, то рассмотрим алгоритм некоторых таких программ и то, как они сравнивают текст.

Sklearn Machine Learning
Картинка анонса

Как в лесу найти мошенников (Random Forest)?

Если есть подозрительные транзакции по картам, то на их основе можно предсказывать заведомо мошеннические операции при последующих попытках. Насколько эффективно с этим справится метод ML Random Forest и какие метрики оценки модели лучше использовать на НЕ сбалансированных данных?

Sklearn Machine Learning
Картинка анонса

GridSearchCV. Поиск лучших параметров модели

Подбор параметров – одна из важных задач для построения модели машинного обучения. Изменение параметров модели может принципиально повлиять на ее качество.

Sklearn Machine Learning
Картинка анонса

Машинное обучение: с чего начать или как построить первую модель

Никогда не задумывался, что влияет на цену недвижимости?Рассказываем, как построили первую модель машинного обучения и проанализировали ее качество