Превью для статьи

DataFrame API – придётся учить

Доброе утро, друзья!
В публикации рассмотрю примеры аналогов основных конструкций, используемых в SQL, написанных на синтаксисе Spark DataFrame.

Превью для статьи

Преобразование xml-поля в SQL

В посте рассматривается метод по парсингу информации из xml полей в таблицах различных баз данных в СУБД MS SQL.

Превью для статьи

Как работать с GreenPlum через командную строку

Всем привет! Многие сталкивались с проблемами в работе инструментов для управления базами данных. Основные проблемы связаны с нагромождением дополнительного функционала, который в большинстве случаев не нужен.
Расскажу, как зная SQL и десяток консольных команд, можно значительно ускорить выполнение запросов в GreenPlum с помощью PSQL.

Превью для статьи

Использование SET ANSI_NULLS в SQL

При обработке массивов данных, в процессе создания хранимых процедур, возникает необходимость сравнения нулевых значений. Расскажу, как настроить SQL Server для сравнения операторов со значениями NULL, воспользовавшись инструкцией SET ANSI_NULLS

Превью для статьи

PANDAS VS SQL

Работа с данными с помощью Pandas вместо SQL. Так ли хороша популярная библиотека, разберемся в данном посте

Превью для статьи

Полезные возможности HiveQL

Всё чаще в своей работе мы используем HiveQL, который на первый взгляд ограничен возможностями SQL. В этой статье я расскажу о нескольких встроенных в Hive функциях, которые окажутся очень полезны в работе с url, xml, json и помогут сэкономить нам массу времени.
Также мы рассмотрим функцию, которая позволит более оптимально работать с join при наличии небольших таблиц.

Превью для статьи

Альтернативные методы организации и создания файловых информационных ресурсов

В большинстве случаев файловые информационные ресурсы (ФИР) представляют собой выделенные объемы внешней памяти в виде логических дисков операционной системы со сложной иерархией каталогов.
Отталкиваясь от опыта, поиск информации, размещенной на ФИР, может занять очень много времени, так как это большой объем файлов при отсутствии точной информации об их размещении.
Реальной альтернативой ФИР, соответствующей требованиям текущего времени, выступает реализация хранилища с использованием SQL сервер от компании Microsoft.

Data News