Превью для статьи

Как выбрать формат хранения данных в экосистеме Hadoop

При формировании витрин данных и датасетов в экосистеме Hadoop одним из важных вопросов является выбор оптимального способа хранения данных в hdfs. В частности, в рамках данной публикации будет рассматриваться один из важных вопросов при создании витрины – выбор соответствующего формата файла для хранения.

Превью для статьи

Полируем Parquet

Порой случается так, что различные данные невозможно загрузить, обработать и сохранить для передачи или дальнейшей обработки из-за их большого объема. Тем не менее эту проблему можно решить путем грамотного выбора формата их хранения.

Превью для статьи

Строим Treemap, применяя squarify

Для визуализации данных в Python представлен ряд весьма популярных библиотек, о которых не раз упоминалось в постах на сайте NewTechAudit – это seaborn, matplotlib, plotly. И есть еще одна библиотека, которая чаще всего используется для построения Treemap (древовидной карты) – библиотека squarify, о работе которой я расскажу в этом материале на примере небольших наборов данных.

Превью для статьи

Как реализовать поиск в таблице Vue.JS

Хотим поделиться, как просто можно сделать поиск по таблице во Vue.JS

Превью для статьи

Как предсказать «побег» при помощи ML-модели

Санкционная политика недружественных стран значительно подкосила деятельность Торговых центров. Многие иностранные брэнды закрыли свои магазины в торговых центрах и ушли из России, чем существенно снизили арендный поток. Арендодателям пришлось в срочном порядке искать новых потенциальных арендаторов на освободившиеся места.

Превью для статьи

Реализация линейной регрессии своими руками

Доброе утро, друзья!
Каждый раз, когда Вы используете линейную регрессию прямо «из коробки», задумываетесь ли Вы о том, как она устроена изнутри? Порассуждаем об этом в посте.

Превью для статьи

DataFrame API – придётся учить

Доброе утро, друзья!
В публикации рассмотрю примеры аналогов основных конструкций, используемых в SQL, написанных на синтаксисе Spark DataFrame.

Data News

13-14 марта 2023


📍DevOpsConf