Превью для статьи

Инструкция к применению «Как установить PySpark на Windows и сделать в нём Word2Vec»

Мы говорим Big Data, подразумеваем — Apache Spark. Сейчас это, пожалуй, самый мощный и модный фреймворк для распределённой обработки больших данных в задачах Data Science, поэтому для всех аналитиков как никогда важна задача изучения Spark и получения практических навыков работы с ним. Однако привычная среда обитания Spark — это, как правило, серверные кластеры промышленного масштаба […]

Превью для статьи

Рисуем графы в PyQT

Продолжаем рассматривать графовую аналитику. Мы уже рассказывали о том, что это один из распространенных инструментов в поиске связей в разрозненных данных. В этой статье попробуем с использованием PyQT и networkx сделать простейший инструмент для визуализации связей.

Превью для статьи

Использование Git в IDE PyCharm без CLI

Как организовать процесс написания кода, чтобы в любой момент можно было вернуться к последней рабочей версии? Как с одной стороны не хранить 100500 архивов, а с другой иметь достаточную глубину отката? Как взаимодействовать нескольким участником команды в рамках работы над одной задачей и не затереть чужой код? Разобраться в этих вопросах не вникая во все тонкости работы с командной строкой, попытаемся в этой статье

Превью для статьи

Анализ данных с помощью Google BigQuery

В предыдущей публикации мы написали о возможности обмениваться информацией для построения отчетов на Power BI.
Сейчас мы расскажем об анализе данных с помощью облачного сервиса Google BigQuery.