Превью для статьи

Как измерить опоссумов линейной регрессией

А что если использовать свои навыки регрессии, чтобы предсказать длину головы опоссума по остальным метриками его тела?

Превью для статьи

Прогнозируем реальные вероятности

Может ли модель прогнозировать реальные вероятности? На самом деле абсолютно точно это не может делать ни одна. Можно максимально приблизиться к реальным показателям, но для этого модель должна быть откалибрована (скорректирована так, чтобы полученные показатели распределения вероятностей были как можно ближе к реальным). Так как откалибровать модель?

Превью для статьи

Предсказание количества лайков у комментария в YouTube

Наверняка у каждого хотя бы раз было такое желание, чтоб написать комментарий и получить массу лайков за него. Но тут возникает вопрос: а что нужно написать, чтобы получить максимальное количество лайков? И для этого можно использовать машинное обучение!

Превью для статьи

Делаем генератор синтетических данных на Python с использованием Байесовских сетей

По какой причине газон мокрый? Как дождь влияет на работу поливочной машины и как еще можно использовать модель, расскажем в этой статье.

Превью для статьи

Feature importance в sklearn и catboost на примере классических датасетов

В данной статье будет рассмотрен пример вычисления и визуализации feature importance на классических датасетах iris и wine. Используемые ml-библиотеки: sklearn и catboost. Для визуализации будет использоваться matplotlib.

Превью для статьи

Сравнение различных видов ML классификаторов в задаче распознавания сигналов

Задача состоит в классификации гидроакустических сигналов. Сонары (гидролокаторы) посылают звук высокой частоты в определенном направлении и получают отраженную звуковую волну. По характеристике этой волны можно сделать вывод, от чего именно она отразилась – от морской мины или же от подводного камня, скалы. Используемый для решения задачи набор данных был разработан сотрудником аэрокосмического технологического центра Полом Горманом в разгар холодной войны. Для получения данных металлический цилиндр и цилиндрическая горная порода, оба длиной около 1,5 метров, размещались на песчаном дне океана.

Превью для статьи

Распознавание цифр написанных от руки с помощью Machine Learning

Каждый день люди сталкиваются с огромным количеством данных, но, несмотря на переход к электронному документообороту, встречаются документы, которые отсканированы человеком и содержат рукописный текст, в том числе цифры, даты, подписи и пр.
Распознавание рукописного текста – это огромная проблема, так как существует всего 10 цифр, а почерк человека может сильно варьироваться и порой с задачей распознания рукописного текста не справляется даже сам человек, что уж говорить о почерке врача 😊
Классификация рукописного текста или цифр очень важна на практике, это поможет сократить время на разбор огромного количества данных.
В этой статье я хочу рассмотреть распознавание рукописных цифр от 0 до 9, с использованием известного набора данных digits библиотеки Scikit-learn, применяя классификатор логистической регрессии.

Data News