Превью для статьи

Деревья решений в pySpark: от семечка до параметрической оптимизации случайного леса

Меня зовут Клим, и сегодня я буду вашим проводником в PySpark MLlib. В этом посте я расскажу о простом для понимания, но в то же время достаточно эффективным алгоритме — дерево решений, а также его расширенной модификацией случайные леса решений.

Превью для статьи

Как научить Наивного Байеса давать персональные рекомендации

В публикации расскажу о подходе,
позволяющем расширить функциональные возможности метода Наивного Байеса благодаря использованию весовых коэффициентов для различных групп признаков объекта датасета. С помощью разработанной ML‑модели можно улучшить качество классификации текстов при использовании обучающей выборки небольшого объёма и сократить время обучения модели.

Превью для статьи

Классификация изображений с помощью TensorFlow и Keras

Классифицировать десятки тысяч скриншотов документов по типу.
Когда стоит такая задача, никто не станет перебирать файлы вручную. В этой статье расскажу о своём опыте классификации изображений с использованием нейросети