Python, Программирование

Аналитика в Python

Время прочтения: 2 мин.

Довольно часто требуется информация о состоянии кредитного портфеля для анализа, поиска динамики и закономерностей, а также сравнения по различным категориям продуктов. Для этого довольно удобно использовать сводные таблицы в excel. Но, что делать, если количество строк во много раз превышает возможности excel? — Воспользоваться простотой и удобством Python.

Для работы нам потребуется предварительно подготовленный файл с данными для анализа. Импортируем необходимые поля из БД в файл CSV формата.

Набор полей потребуется следующий: идентификатор, сумма кредита, сумма основного долга, сумма просроченной задолженности и дата ее образования при наличии.

Далее запускаем python и импортируем 2 библиотеки:

Считываем файл:

Проверяем содержимое:

Замечаем, что просроченная задолженность отсутствует, а дата в непонятном формате:

Для корректной работы преобразовываем дату в пустоту:

Преобразовываем дату в необходимый период (в данном случае нас интересует динамика по месяцам) и производим расчеты:

Переименовываем названия столбцов для наглядности:

Смотрим, что получилось:

По итогу получаем сводную таблицу, которую легко анализировать и к которой так привыкли по работе в excel.

Советуем почитать