Время прочтения: 3 мин.
Суть манипуляции сводилась к намеренному и неоднократному изменению бизнес-сегмента клиента при отсутствии на то оснований с целью достижения определенных показателей.
Как мы действовали?
1. Сформировали базу клиентов, у которых есть данные в Спарк-Интерфакс по объему годовой выручки.
2. Сравнили объем выручки и присвоенный клиенту бизнес-сегмент. Получилось, что каждый пятый клиент не соответствует требованиям по выручке к сегменту.
3. Из базы отобрали клиентов, по которым сегмент в течение года менялся 3 и более раз. По выбранной совокупности строили граф процесса.
Основные этапы проекта:
- выгрузка логов из источника данных;
- обработка и подготовка данных в python (библиотека pandas)
import pm4py
import pandas as pd
import os
curdir=os.getcwd()
os.environ["PATH"] +=os.pathsep + r'C:\...\graphviz-2.38\release\bin' #библиотека для отрисовки
- построение графа процесса бизнес-сегментации клиентов с помощью библиотеки pm4py (библиотека алгоритмов процессной аналитики для языка программирования Python);
На этом этапе использована документация с официального сайта модуля.
from pm4py.objects.conversion.log import factory as log_conv
log = log_conv.apply(pd2)
from pm4py.objects.log.util import sorting
log = sorting.sort_timestamp(log)
from pm4py.algo.discovery.dfg import factory as dfg_factory
from pm4py.visualization.dfg import factory as dfg_vis_factory
dfg = dfg_factory.apply(log, variant="frequency")
gviz = dfg_vis_factory.apply(dfg, log=log, variant="frequency") #performance frequency
dfg_vis_factory.view(gviz)
- анализ графа, выявление отклонений;
В связи с широким диапазоном исследуемого периода (4 года), для более детальной визуализации, было принято решение сегментировать логи в разрезе нескольких лет.
С использованием библиотеки pm4py получен граф процесса:
Анализ графа процесса позволил увидеть отклонения на этапе изменения сегмента.
Наиболее массовые изменения сегмента происходили в течение одного года (от 3-х до 6 раз по клиенту), тогда как бизнес-сегмент должен утверждаться при изменении годовой выручки компании.
На графе четко видны цикличные смены сегмента в одном периоде, что навело нас на мысль о возможной манипуляции сегментом и было принято решение о проведении более детального анализа.
Дальнейший анализ обогащенных данных дал возможность установить нарушения и их последствия.
- обогащение данных по отклонениям сведениями из других источников для подробного анализа;
На этом этапе были выгружены данные о годовой выручке клиентов из Спарк-Интерфакс и информация о сделках из внутренних систем, чтобы детально разобраться в причинах и последствиях манипуляций.
Проведенный анализ показал, что процесс сегментации клиентов имеет существенные недостатки, позволяющие сотрудникам осуществлять действия по необоснованному изменению бизнес-сегмента клиента для достижения конкретных целей, а именно:
-намеренно удерживать клиента в несвойственном ему сегменте с целью выполнения плановых показателей;
-осуществлять кредитование в рамках продуктов, не предназначенных для реального целевого клиентского сегмента, с целью удовлетворения потребностей клиента;
-распределять клиентов между сегментами с целью покрытия дефицита отдельных показателей бизнес-плана подразделения;
-позволяет кредитовать на более льготных условиях — без основного обеспечения/поручительства бенефициара/консолидированной отчетности.
- выводы, формирование предложений для руководства;
Мы на практике убедились, что Process Mining позволяет оперативно искать узкие места в бизнес процессах, эффективно выявлять дефекты и своевременно принимать меры по минимизации рисков компании.