Деревья решений в pySpark: от семечка до параметрической оптимизации случайного леса

Советуем почитать

Генерация паспортных данных для обучения моделей

Я знаю, что ты делал этой ночью

LLM'ы в преобразовании запроса на естественном языке в SQL (text2sql)

Ускоряем обучение с подкреплением на 50%

Доверительный интервал коэффициента Джини. Что это?

Создание персонажей в Python с помощью LLM: from GPT to Kandinsky

Data News

16-17 апреля 2024 года

XVI Национальная конференция ИВА «Внутренний аудит в России

26-27 июля 2024 года

PyCon Russia - конференция для python-разработчиков

Превью для статьи

19.10.2023, Портнов Клим, г. Москва

Деревья решений в pySpark: от семечка до параметрической оптимизации случайного леса

Меня зовут Клим, и сегодня я буду вашим проводником в PySpark MLlib. В этом посте я расскажу о простом для понимания, но в то же время достаточно эффективным алгоритме — дерево решений, а также его расширенной модификацией случайные леса решений.

Machine learning and neural networks Технологии аудита

Превью для статьи

21.04.2023, Дворников Дмитрий,г. Москва

Как научить Наивного Байеса давать персональные рекомендации

В публикации расскажу о подходе,
позволяющем расширить функциональные возможности метода Наивного Байеса благодаря использованию весовых коэффициентов для различных групп признаков объекта датасета. С помощью разработанной ML‑модели можно улучшить качество классификации текстов при использовании обучающей выборки небольшого объёма и сократить время обучения модели.

Machine learning and neural networks Другие технологии

Превью для статьи

03.06.2021, Карпова Наталья, г. Иркутск

Классификация изображений с помощью TensorFlow и Keras

Классифицировать десятки тысяч скриншотов документов по типу.
Когда стоит такая задача, никто не станет перебирать файлы вручную. В этой статье расскажу о своём опыте классификации изображений с использованием нейросети

Computer vision Технологии аудита