Время прочтения: 2 мин.

Очень часто сотрудник внутреннего аудита банка не обладает доступом к файлам-событий из соображений безопасности сохранения данных. Но если возникает потребность в проверке корректности выполнения процесса, приходится выходить из ситуации, используя доступную информацию. Необходимые данные для создания процесса находятся разрозненно в таблицах информационной системы банка. В нашем случае был известен только электронный след события, под которым подразумевался факт совершения действия и дата. В результате сбора информации был создан файл, содержащий следующие данные: номер кредита, дата начала кредита, дата начала переменной ставки, дата начала страхового периода, окончание страхового периода и дата окончания кредита. Чтобы построить файл логов потребовалось для начала их создать на основе информации, содержащейся в ячейках таблицы. Инструментом создания файла логов был язык программирования python. 

Алгоритм создания лог-файла состоял из следующих этапов:

  • создание структуры для анализа, где в качестве поля ID являлся номер кредитного договора, в качестве поля timestamp – значения, указанные в каждом поле для даты, названия столбцов послужили данными для поля события:
new_data = pd.DataFrame({"case:concept:name":[], "concept:name":[], "time:timestamp":[]})
for i in data.index:
    for item in range(1, data.shape[1]):
        row = {}
        row["case:concept:name"] = str(data.iloc[i].iloc[0])
        row["concept:name"] = data.columns[item]
        row["time:timestamp"] = data.iloc[i].iloc[item]
        new_data = new_data.append(row, ignore_index=True)
  • удаление пропусков в логах, так как не все даты были занесены в первоначальной таблице
buf_data = new_data.dropna()
  • выполнение сортировки данных по ID и времени выполнения действий.
data = buf_data.sort_values(["case:concept:name", "time:timestamp"])

Созданный файл позволил произвести построение неидеального процесса, применив модели из библиотеки pm4py.

В результате добавления стадии предобработки данных электронных следов событий был создан лог файл для построения процесса на основе технологии Process Mining. Это позволило сотрудникам внутреннего аудита выявлять нарушения в исследуемом процессе даже при отсутствии данных, необходимых для применения технологий.