Подготовка данных Machine Learning
Картинка анонса

Оптимизация запросов HIVE

В Hive запросы даже небольших объемов данных занимают минуты. Предлагаем ознакомиться с основными методами автоматизации, позволяющими достичь существенного увеличения производительности.

Подготовка данных Machine Learning
Картинка анонса

Оптимизация запросов HIVE

В Hive запросы даже небольших объемов данных занимают минуты. Предлагаем ознакомиться с основными методами автоматизации, позволяющими достичь существенного увеличения производительности.

SQL
Картинка анонса

Функция OPENJSON в SQL Server

С выходом SQL Server 2016 был реализован нативный функционал JSON. Это формат представления данных, который интерпретируется и передаётся независимо от платформы, являясь облегчённым форматом обмена данных между системами. JSON является основным конкурентом XML и с каждым годом для Web-API доля разрабатываемых систем, использующих JSON растёт.

SQL Java
Картинка анонса

Модели – SQL VS Java

Как строятся модели мы уже рассказывали, но при этом обошли самый популярный инструмент после excel — это SQL. Да, на нем тоже можно писать модели. И это даже очень удобно, так как в одном флаконе и доступ к данным, которые позволят обратиться и выбрать именно то, что надо. Но насколько подходит SQL для построения модели? Об этом в нашей статье.

Python
Картинка анонса

Использование оператора IN для нескольких групп полей при помощи Python

Дата-аналитик редко сталкивается только с одним видом баз данных. Это может быть база Oracle, MS SQL, TERADATA, Облако данных и другие.
Иногда есть возможность импорта в базу данных, но, когда его нет, на помощь приходит Python совместно с оператором SQL IN. Особенно удобно его использовать в базе данных Oracle, но есть способ и для T-SQL.

Анализ данных SQL
Картинка анонса

Что такое накопительный(промежуточный) итог SQL и как его вычислить?

Расчет промежуточного итога SQL — это очень распространенный шаблон, часто используемый в анализе. В этой статье вы узнаете, что такое промежуточный итог и как написать SQL-запрос для его вычисления.

Анализ данных SQL
Картинка анонса

Как найти дату предшествующую отчетной?

На просторах сети интернет достаточно примеров по поиску значения даты, предшествующей отчетной. Но я не встретил примеров, которые бы помогли определить дату, в частности дату проведения операции, которая может быть меньше на дни, месяцы, годы…

Анализ данных SQL
Картинка анонса

Использование оператора EXISTS в анализе данных

Наиболее популярными условиями для выборки и анализа данных чаще всего используют «JOIN», «LIKE», «IN», но они имеют слабую оптимизацию и ограничения в виде максимального количества выражений. В свою очередь условие «EXISTS» хотя и считается менее эффективным, значительно сокращает избыточность написания запроса и позволяет использовать в запросе Булеву логику.

Загрузить ещё