Мониторинг ресурсов Spark-приложений с помощью Python

Советуем почитать

Как скачать отчёты из Power BI на диск с помощью PowerShell

Генерация приложений “по требованию” (ODAG) в QlikSense

Direct Discovery или работа с большими данными в Qlik Sense

Интерактивный Notebook – легко!

Расширение возможностей Qlik Sense с помощью extensions

«Кракен»: очередная мутация COVID-19

Data News

16-17 апреля 2024 года

XVI Национальная конференция ИВА «Внутренний аудит в России

26-27 июля 2024 года

PyCon Russia - конференция для python-разработчиков

Превью для статьи

07.02.2023, Кравченко Александр, г. Новосибирск

Мониторинг ресурсов Spark-приложений с помощью Python

Доброе утро, друзья!
Каждый пользователь создает нагрузку на кластер, и посмотреть параметры каждого работающего Spark-приложения возможно в представлении Resource manager UI через YARN.

BI and visualization Другие технологии

Превью для статьи

30.11.2022, Сагдеев Ильдар, г. Уфа

Создание и удаление таблиц в Apache Hadoop c использованием PySpark

Сегодня я расскажу, как затратив минимум усилий при работе с большими данными, справиться с задачей создания таблиц с нужными параметрами, а также как удалить сразу большое количество потерявших актуальность таблиц

Databases and big data Другие технологии

Превью для статьи

28.01.2022, Кагерманов Рамазан, г. Москва

Spark Workflow

Рассмотрим, что происходит от старта до окончания работы Spark приложения

Databases and big data Другие технологии

Превью для статьи

18.06.2021, Фадюшина Маргарита, г. Иркутск

Параметрическая оптимизация задач Spark

Скорость обработки больших данных средствами фреймворка Apache Spark во мно-гом обеспечивается грамотной настройкой его параметров. Об этом мы и поговорим в данной статье

Databases and big data Другие технологии

Превью для статьи

30.04.2021, Фурзанов Кирилл, г. Иркутск

Обработка больших данных средствами PySpark SQL

Наиболее популярными инструментами для сбора и обработки больших данных являются Hadoop MapReduce и Apache Spark. Оба этих инструмента имеют свои плюсы и минусы, однако в данной статье я буду рассматривать Apache Spark, в частности библиотеку для python PySpark. Любая программа на PySpark начинается с определения конфигурации запускаемой задачи. В PySpark конфигурация задается классом SparkConf. Основными […]

Databases and big data Другие технологии