Превью для статьи

В погоне за космическим Титаником

Хочу рассказать об опыте применения разведочного анализа (EDA) для улучшения точности ML-модели, на примере задачи из соревнования Spaceship Titanic

Превью для статьи

Ансамбли моделей для распознавания рукописных цифр

Применение нескольких моделей машинного обучения для решения задачи является частой практикой. Данная технология выигрывает по качеству в сравнении с одной моделью. Однако, для успешного результата такой технологии необходимо разбираться в ее модификациях. Расскажу об алгоритмах ансамблирования

Превью для статьи

Работа с текстом в табличных данных (BERT + Ridge + CatBoost)

Табличные данные могут быть представлены по-разному: от простейших количественных измерений по каждому наблюдению, до привязки к нему текста или изображений. Данный пост о кейсе обработке текста в «табличках» с помощью BERT + Ridge и CatBoost.

Превью для статьи

ГРАДИЕНТНЫЙ БУСТИНГ С CATBOOST (ЧАСТЬ 3/3)

В предыдущих частях мы рассматривали задачу бинарной классификации. Если классов более, чем два, то используется MultiClassification, параметру loss_function будет присвоено значение MultiClass. Мы можем запустить обучение на нашем наборе данных, но мы получим те же самые результаты, а обучение будет идти несколько дольше:

Превью для статьи

Adversarial Validation

Модель хорошо адаптировалась к наблюдениям из обучающего датасета, но показала плохое качество предсказания на тестовом? Расскажу о способе, который поможет заранее предусмотреть, чтобы такая проблема при обучении модели не случилась

Превью для статьи

Предсказание количества лайков у комментария в YouTube

Наверняка у каждого хотя бы раз было такое желание, чтоб написать комментарий и получить массу лайков за него. Но тут возникает вопрос: а что нужно написать, чтобы получить максимальное количество лайков? И для этого можно использовать машинное обучение!

Превью для статьи

Градиентный бустинг с CatBoost (часть 2/3)

Продолжим разговор о CatBoost и рассмотрим Cross Validation, Overfitting Detector, ROC-AUC, SnapShot и Predict.