Превью для статьи

Как измерить опоссумов линейной регрессией

А что если использовать свои навыки регрессии, чтобы предсказать длину головы опоссума по остальным метриками его тела?

Превью для статьи

Снижаем размерность. Факторный анализ и метод главных компонент

Чтобы решить задачу прогнозирования, автор этого поста решил повысить информативность данных. Он рассказал, как с помощью метода главных компонент возможно снизить шум, исключить дублирование информации и уменьшить время на обработку.

Превью для статьи

FLAML: Быстрая библиотека для автоматизированного машинного обучения

Если вы занимаетесь машинным обучением и никогда раньше использовали AutoML в Python, то данный пост будет полезен. Я покажу, как использовать FLAML для автоматизированного машинного обучения

Превью для статьи

Оптимизация гиперпараметров с W&B Sweeps

Зачастую недостаточно только выбрать архитектуру модели, нужно оптимизировать её гиперпараметры под конкретную задачу. Сегодня мы познакомимся с инструментом, удобным в использовании и легко встраиваемым в любой код.

Превью для статьи

Подбор параметров для построения модели для различных видов переменных

При построении моделей, не зависимо от используемого метода, выбор используемых при построении признаков оказывает значительное влияние на результат. Правильный подбор и фильтрация позволяют не только ускорить обработку данных, но и вероятно улучшить качество модели в целом. Именно поэтому правильный алгоритм определения значимых признаков играет большую роль, что и будет рассмотрено в данной статье.

Превью для статьи

Дисбаланс классов при классификации

При решении практических задач классификации часто приходится сталкиваться с дисбалансом классов. Такая ситуация может влиять на итоговый результат модели. Хочу рассказать, как дисбаланс и его устранение отражается на результатах классификации на примере простого классификатора логистической регрессии.

Превью для статьи

Снижение размерности

Всем привет! В статье рассматривается два популярных алгоритма уменьшения размерности, а именно T-distributed Stochastic Neighbor Embedding (t-SNE) и Uniform Manifold Approximation and Projection (UMAP). Их удобно использовать, когда необходимо визуализировать данные с большим количеством параметром (также будем называть это размерностью данных).