Время прочтения: 2 мин.
Довольно часто требуется информация о состоянии кредитного портфеля для анализа, поиска динамики и закономерностей, а также сравнения по различным категориям продуктов. Для этого довольно удобно использовать сводные таблицы в excel. Но, что делать, если количество строк во много раз превышает возможности excel? — Воспользоваться простотой и удобством Python.
Для работы нам потребуется предварительно подготовленный файл с данными для анализа. Импортируем необходимые поля из БД в файл CSV формата.
Набор полей потребуется следующий: идентификатор, сумма кредита, сумма основного долга, сумма просроченной задолженности и дата ее образования при наличии.
Далее запускаем python и импортируем 2 библиотеки:
Считываем файл:
Проверяем содержимое:
Замечаем, что просроченная задолженность отсутствует, а дата в непонятном формате:
Для корректной работы преобразовываем дату в пустоту:
Преобразовываем дату в необходимый период (в данном случае нас интересует динамика по месяцам) и производим расчеты:
Переименовываем названия столбцов для наглядности:
Смотрим, что получилось:
По итогу получаем сводную таблицу, которую легко анализировать и к которой так привыкли по работе в excel.