Превью для статьи

Использование SET ANSI_NULLS в SQL

При обработке массивов данных, в процессе создания хранимых процедур, возникает необходимость сравнения нулевых значений. Расскажу, как настроить SQL Server для сравнения операторов со значениями NULL, воспользовавшись инструкцией SET ANSI_NULLS

Превью для статьи

Автоматизированная загрузка массива CSV в БД

Не исключена ситуация, когда необходимо загрузить данные из нескольких фалов CSV в одну таблицу какой-либо базы данных. Если загружать 2-3 файла вручную, то это ещё терпимо, но загрузка 10 файлов уже может оказаться затратной по времени. Рассмотрю, как автоматизировать данный процесс

Превью для статьи

Подход к прогнозированию кредитного риска

При формировании резервов Компания должна ориентироваться на изменение риска наступления дефолта по финансовому активу.
Одним из методов прогнозирования вероятности дефолта является подход на основе цепей Маркова – матрица перехода Маркова. Это квадратная матрица, которая описывает вероятность перехода субпортфеля/заемщика из одного этапа в другой.
В этой статье описывается процесс построения матриц миграции и предлагается код, написанный на языке Python, с помощью которого можно возвести квадратную матрицу в необходимую степень.

Превью для статьи

Ого! Teradata!

При работе с данными из нескольких источников возникает потребность загружать свои данные в таблицы на пром-сервер, но к сожалению, не всегда для этого есть табличное пространство. В таких случаях приходится использовать временные таблицы, которые живут во время сессии, и удаляются по ее завершении.

Превью для статьи

Использование оператора IN для нескольких групп полей при помощи Python

Дата-аналитик редко сталкивается только с одним видом баз данных. Это может быть база Oracle, MS SQL, TERADATA, Облако данных и другие.
Иногда есть возможность импорта в базу данных, но, когда его нет, на помощь приходит Python совместно с оператором SQL IN. Особенно удобно его использовать в базе данных Oracle, но есть способ и для T-SQL.

Превью для статьи

Автоматизация загрузки данных из Oracle в MS SQL Server с помощью Python, без создания таблиц вручную и указания типа полей

Задачу по загрузке данных из Oracle и их записи в таблицу на MS SQL Server можно решить большим количеством способов. Как правило, даже для выполнения простого запроса приходится потратить большое количество времени, особенно, когда надо передать в Oracle перечень ID для поиска информации. Для решения задачи можно загрузить данные в файлы, затем написать код создания […]

Превью для статьи

Реализация ETL процесса для PostgreSQL

Добрый день, друзья!
Существует множество источников данных. Источники, как и сами данные, в значительной степени отличаются друг от друга. ETL (Extract Transform Load) позволяет организовать процессы передачи и преобразовании данных между различными источниками. Наиболее распространёнными источниками данных являются СУБД (Системы Управления Базами Данных).