Инструкция к применению «Как установить PySpark на Windows и сделать в нём Word2Vec»

Советуем почитать

Обработка записей разговоров на Python. Поиск пересечений в диалоге

DeepPavlov «из коробки» для задачи NLP на Python

Снижаем размерность эмбеддингов предложений для задачи определения семантического сходства

Пайплайн для создания классификации текстовой информации

Поиск ошибок в логике работы чат-бота с помощью TF-IDF и DBSCAN

Оценка качества работы систем Speech to Text

Data News

16-17 апреля 2024 года

XVI Национальная конференция ИВА «Внутренний аудит в России

26-27 июля 2024 года

PyCon Russia - конференция для python-разработчиков

Превью для статьи

07.09.2021, Андрей Карпенко, г. Воронеж

Инструкция к применению «Как установить PySpark на Windows и сделать в нём Word2Vec»

Мы говорим Big Data, подразумеваем — Apache Spark. Сейчас это, пожалуй, самый мощный и модный фреймворк для распределённой обработки больших данных в задачах Data Science, поэтому для всех аналитиков как никогда важна задача изучения Spark и получения практических навыков работы с ним. Однако привычная среда обитания Spark — это, как правило, серверные кластеры промышленного масштаба […]

Text mining Технологии аудита

Превью для статьи

20.04.2021, Роман Иов, г. Иркутск

Рисуем графы в PyQT

Продолжаем рассматривать графовую аналитику. Мы уже рассказывали о том, что это один из распространенных инструментов в поиске связей в разрозненных данных. В этой статье попробуем с использованием PyQT и networkx сделать простейший инструмент для визуализации связей.

Graph mining Технологии аудита

Превью для статьи

19.04.2021, Дмитрий Багдасарян, г. Краснодар

Использование Git в IDE PyCharm без CLI

Как организовать процесс написания кода, чтобы в любой момент можно было вернуться к последней рабочей версии? Как с одной стороны не хранить 100500 архивов, а с другой иметь достаточную глубину отката? Как взаимодействовать нескольким участником команды в рамках работы над одной задачей и не затереть чужой код? Разобраться в этих вопросах не вникая во все тонкости работы с командной строкой, попытаемся в этой статье

Code Mining Технологии аудита

Превью для статьи

08.02.2021, Быков Андрей, г. Санкт- Петербург

Анализ данных с помощью Google BigQuery

В предыдущей публикации мы написали о возможности обмениваться информацией для построения отчетов на Power BI.
Сейчас мы расскажем об анализе данных с помощью облачного сервиса Google BigQuery.

Databases and big data Другие технологии