Python Machine Learning
Картинка анонса

Создаем случайные наборы данных

Когда речь заходит о машинном обучении, сразу возникает необходимость получения набора данных для проведения обучения модели. Безусловно, большое количество датасетов можно найти в открытом доступе и среди таких ресурсов можно отметить, например, Kaggle, VisualData, Machine Learning Repository. Однако, всегда полезно извлекать данные самостоятельно и иметь собственный набор данных. Как это сделать, сгенерировав случайный датасет, в Python с помощью Numpy и Sklearn расскажу в этой статье

Python Machine Learning
Картинка анонса

Создаем случайные наборы данных

Когда речь заходит о машинном обучении, сразу возникает необходимость получения набора данных для проведения обучения модели. Безусловно, большое количество датасетов можно найти в открытом доступе и среди таких ресурсов можно отметить, например, Kaggle, VisualData, Machine Learning Repository. Однако, всегда полезно извлекать данные самостоятельно и иметь собственный набор данных. Как это сделать, сгенерировав случайный датасет, в Python с помощью Numpy и Sklearn расскажу в этой статье

Python Machine Learning
Картинка анонса

Сравнение различных видов ML классификаторов в задаче распознавания сигналов

Задача состоит в классификации гидроакустических сигналов. Сонары (гидролокаторы) посылают звук высокой частоты в определенном направлении и получают отраженную звуковую волну. По характеристике этой волны можно сделать вывод, от чего именно она отразилась – от морской мины или же от подводного камня, скалы. Используемый для решения задачи набор данных был разработан сотрудником аэрокосмического технологического центра Полом Горманом в разгар холодной войны. Для получения данных металлический цилиндр и цилиндрическая горная порода, оба длиной около 1,5 метров, размещались на песчаном дне океана.

Python Pandas
Картинка анонса

Создаем отчеты для моделей машинного обучения с evidently

Evidently помогает оценивать и контролировать модели в производственной среде. Сегодня я расскажу как создать такой отчет.

Sklearn Pandas
Картинка анонса

Методы Pandas и Scikit-learn для подготовки данных

При подготовке структурированных данных использование языка программирования Python и в частности применение методов библиотек Pandas и Scikit-learn – это один из способов успешного решения такой задачи для Data Science специалиста.

Pandas Machine Learning
Картинка анонса

Полиномиальная регрессия и метрики качества модели

Применение линейной регрессии “из коробки” – задача нетривиальная. Но важно понимать метрики качества модели, а также то, что задача не всегда может сводится к стандартной линейной функции.

Python Machine Learning
Картинка анонса

Машинное обучение. Опыт использования классификатора библиотеки Python Xgboost

Добрый день!
В сегодняшней статье хочу поделиться опытом использования xgboost/sklearn для задачи определения потенциально мошеннических операций, совершаемых клиентами кредитной организации.

Sklearn Machine Learning
Картинка анонса

Выбираем метод для поиска схожих операций

ML – панацея для любых задач или способ определить лучшие подходы для реализации? В своей статье я проведу сравнение различных по своей сути моделей кластеризации и простого метода расчета расстояния между точками при решении прикладной задачи поиска схожих операций.

Загрузить ещё