Превью для статьи

Feature engineering и кластерный анализ клиентов на PySpark

Кластеризация клиентов является важным инструментом, так как позволяет лучше понимать клиентов и предлагать им более персонализированный сервис. Также она может быть полезна для компании в поиске решения при возникновении проблем с клиентами. Побробнее в публикации.

Превью для статьи

Бамбук, Mito-лист и Деталь, или как подготовиться ко встрече с пандами

Как часто вы сталкиваетесь с необходимостью выгрузить в MS Excel более миллиона строк? Все фильтры на выгрузку уже были наложены ранее, но, увы, она до сих пор «не проходит по габаритам». Перед нами встает дилемма – делить, или … воспользоваться готовыми решениями для python, не изучая python!

Превью для статьи

3 пакета Python для генерации синтетических данных

Нет данных? Сгенерируй!
Рассмотрим три способа генерации синтетических данных с помощью пакетов Python.

Превью для статьи

Проверка гипотез на python

С каждым днем количество данных становится больше и больше. И как говорится, чем больше ты знаешь, тем больше ты задаешь вопросов, и тем больше ты хочешь получить ответов. Получить ответы на основе данных можно с помощью статистики. А именно, если требуется что-то сравнить, поможет проверка статистических гипотез

Превью для статьи

Folium и geopandas для помощи аналитику геоданных.

В данной статье рассмотрена возможность создания интерактивной карты с помощью библиотеки folium, а также реализация возможности добавления интересующих метрик и статистик для объектов карты, с целью упростить работу аудиторов при проведении проверок.

Превью для статьи

Шаги построения рекомендательной системы в обучении персонала

Широкое распространение в последние годы получили программы, которые пытаются предсказать, какие объекты будут интересны пользователю, имея определенную информацию о его профиле. До 2006 года такие алгоритмы не пользовались популярностью. Но все изменилось осенью 2006 года, когда компания Netflix предложила разработчикам 1 000 000$ за лучший алгоритм предсказания. Конкурс продлился 3 года.
Расскажем сегодня о своем опыте построения рекомендательной системы в обучении персонала.

Превью для статьи

Статистика и никакого мошенничества

Часто сталкиваетесь с необходимостью визуализировать данные c помощью сводных таблиц и т.д.? А что если N число строк — это сухо и скучно? В этом случае необходима визуализация при помощи графиков и диаграмм. А что делать, если результаты гипотезы не совпадают с «ожиданием»? О том, как аудитору разобраться в фиктивной статистике читайте в нашей статье.