Превью для статьи

Как поймать опоссума логистической регрессией

Привет! Ранее я уже измеряла опоссумов линейной регрессией, предсказывала размеры тела по остальным метрикам. А что, если необходимо не предсказать значение, а разбить на классы? Например, мальчик или девочка, место ловли опоссума или популяцию.
В таком случае необходимо произвести классификацию. Предлагаю воспользоваться логистической регрессией.

Превью для статьи

Обнаружение фейковых новостей по их заголовкам

Фальшивые новости – проблема современного общества. Такие новости без труда вводят людей в заблуждение через различные социальные сети, мессенджеры и СМИ. Всё это может привести к дезинформации населения, манипуляциям со стороны власти и общественным кризисам.

Превью для статьи

Создаем случайные наборы данных

Когда речь заходит о машинном обучении, сразу возникает необходимость получения набора данных для проведения обучения модели. Безусловно, большое количество датасетов можно найти в открытом доступе и среди таких ресурсов можно отметить, например, Kaggle, VisualData, Machine Learning Repository. Однако, всегда полезно извлекать данные самостоятельно и иметь собственный набор данных. Как это сделать, сгенерировав случайный датасет, в Python с помощью Numpy и Sklearn расскажу в этой статье

Превью для статьи

Сравнение различных видов ML классификаторов в задаче распознавания сигналов

Задача состоит в классификации гидроакустических сигналов. Сонары (гидролокаторы) посылают звук высокой частоты в определенном направлении и получают отраженную звуковую волну. По характеристике этой волны можно сделать вывод, от чего именно она отразилась – от морской мины или же от подводного камня, скалы. Используемый для решения задачи набор данных был разработан сотрудником аэрокосмического технологического центра Полом Горманом в разгар холодной войны. Для получения данных металлический цилиндр и цилиндрическая горная порода, оба длиной около 1,5 метров, размещались на песчаном дне океана.

Превью для статьи

Создаем отчеты для моделей машинного обучения с evidently

Evidently помогает оценивать и контролировать модели в производственной среде. Сегодня я расскажу как создать такой отчет.

Превью для статьи

Методы Pandas и Scikit-learn для подготовки данных

При подготовке структурированных данных использование языка программирования Python и в частности применение методов библиотек Pandas и Scikit-learn – это один из способов успешного решения такой задачи для Data Science специалиста.

Превью для статьи

Полиномиальная регрессия и метрики качества модели

Применение линейной регрессии “из коробки” – задача нетривиальная. Но важно понимать метрики качества модели, а также то, что задача не всегда может сводится к стандартной линейной функции.

Data News