“Владелец подземелья” или автоматизация администрирования Hadoop кластера

Советуем почитать

“Владелец подземелья” или автоматизация администрирования Hadoop кластера

«Консервируем» данные: модули pickle и dill

Из PDF в Excel, когда не все так просто…

Как привести динамически-структурированные JSON в формат Key: Value

Примеры ООП на JavaScript с использованием jQuery – легко и просто! И немного Python-а. ЧАСТЬ 3

Оптимизации работы Jupyter notebook при помощи параллельных вычислений (Библиотека Joblib)

Data News

16-17 апреля 2024 года

XVI Национальная конференция ИВА «Внутренний аудит в России

26-27 июля 2024 года

PyCon Russia - конференция для python-разработчиков

Превью для статьи

16.01.2024, Арсимбеков Рамиль, г. Санкт-Петербург

“Владелец подземелья” или автоматизация администрирования Hadoop кластера

В данной публикации я расскажу о личном опыте взаимодействия с ResourceManager REST API и возможностях взаимодействия с приложениями через него.

Data manipulation Другие технологии

Превью для статьи

09.01.2024, Шайдурова Арина,г. Иркутск

Создание персонажей в Python с помощью LLM: from GPT to Kandinsky

Поделюсь опытом использования больших языковых моделей (LLM) для создания персонажей с Python и моделей OpenAI и Sber.

Machine learning and neural networks Технологии аудита

Превью для статьи

21.08.2023, Коробова Марина, г. Екатеринбург

Применение эффективного асинхронного web-парсинга при работе с Bigdata

Многие компании и организации занимаются сбором большого объема внешних данных для анализа и принятия эффективных решений. Конечно, всё это можно делать вручную, но это долгий, монотонный и нецелесообразный процесс, в котором есть шанс допустить ошибки. В этой публикации мы сравним два инструмента для автоматизации сбора данных из внешних источников Scrapy и BeautifulSoup4

Web scraping и web разработка Другие технологии

Превью для статьи

07.02.2023, Кравченко Александр, г. Новосибирск

Мониторинг ресурсов Spark-приложений с помощью Python

Доброе утро, друзья!
Каждый пользователь создает нагрузку на кластер, и посмотреть параметры каждого работающего Spark-приложения возможно в представлении Resource manager UI через YARN.

BI and visualization Другие технологии

Превью для статьи

05.12.2022, Николаев Николай, г. Новосибирск

Получение данных из Qlik Sense с использованием REST API и Python

Qlik Sense является приложением для визуализации, анализа и мониторинга данных. С помощью Qlik Sense можно опубликовать дашборд, в котором необходимую информацию можно представить в виде таблиц и графиков. Интерфейс Qlik Sense (QS) интуитивно понятен — при помощи стандартных элементов управления QS можно выводить различные срезы информации, задавать фильтры, взаимодействовать с диаграммами и таблицами. Однако может возникнуть задача сохранить данные визуального элемента (например, таблицы) QlikSense в Excel. В данной публикации рассмотрим способ получения данных из Qlik Sense с использованием REST API и Python.

Web scraping и web разработка Другие технологии

Превью для статьи

26.09.2022, Горюнов Дмитрий, г. Самара

Web-Scraping с применением библиотек BeautifulSoup4 + Asyncio

Библиотеки BeautifulSoup4 (BS4) и Asyncio помогут ускорить извлечение данных с веб-страниц сайтов сети интернет. Подробнее в посте.

Web scraping и web разработка Другие технологии

Превью для статьи

28.06.2022, Биссеринкин Андрей, г. Воронеж

THREADING. ЗАЧЕМ?

В данном материале рассматривается многопоточность, как один из подходов, который позволяет быстрее решать задачи, связанные с вводом-выводом, а также процесс написания парсера на его основе

Web scraping и web разработка Другие технологии