Время прочтения: 4 мин.

Как вы могли заметить, такие инструменты как Disco, ProM и Celonis являются настоящим кладом для исследования бизнес-процессов с помощью логов. Пару слов о них. Что же из себя представляют логи? Лог – это файл, содержащий в себе системную информацию работы какой-либо системы, в который заносятся определенные действия пользователя или программы. В русскоязычном варианте часто употребляют аналогичное понятие – журнал. Ниже приведен пример фрагмент лог-файла:

Для поиска различных insight’ов в бизнес-процессе, минимальными и необходимыми полями будут являться:

  1. Case ID – Объект
  2. Activity – действие или событие объекта Case ID
  3. Timestamp – время, когда произошло событие

Мы разобрали какие данные нужны для анализа, теперь рассмотрим, что же ждёт нас на выходе работы mining-алгоритма:

У данного графа есть вершины и ребра, где обязательно имеются начальная и конечная вершины, сами события, которые происходили в бизнес-процессе, а также направленные ребра, которые показывают какое событие шло раньше или позже относительно других. Этот граф очень важен для анализа текущего состояния бизнес-процесса, так как он позволяет найти отклонения от того же процесса, который прописан в нормативных документах как идеальный.

Теперь перейдём к самому вкусному! Если представить наши входные данные как говядину или свинину, в зависимости от того, что кому нравиться), то пропустив мясо через мясорубку, в нашем случае это будут либо Disco, либо ProM, либо Celonis, можно получить разного качества фарш, соответственно, наша итоговая карта процесса.

И выбор того или иного инструмента, будет сильно влиять на качество этого самого фарша!

            Рассмотрим некоторую функциональность каждой “мясорубки” и сравним, какие из опций доступны в той или иной среде и каковы основные различия.

Функциональность ProM (v. 6.5.1) Disco (v. 1.9.5) Celonis Описание
Типы входящих лог-файлов MXML, XES CSV, XLS, MXML, XES, FXL CSV, XLS Поддерживаемые форматы входных данных
Ограничение по количеству строк Неограниченно До 5 миллионов событий В зависимости от ограничения базы данных Максимальное количество строк для исследования
Лицензия Открытая Пробная(30 дней), Академическая, Коммерческая Пробная(30 дней), Академическая, Коммерческая Тип лицензии отличается периодом использования и функциональностью
Типы моделей для анализа BPMN, WF, Petri nets, ECPs, Transition systems, Heuristics и др. Fuzzy model Fuzzy model, Support of charts Какая модель будет применяться для анализа логов
Поддерживаемые платформы Desktop Version Desktop Version Web, Software as a service version Типы платформ, где может быть установлено ПО
Фильтрация данных ✔️ ✔️  ✔️ Выбор определенного пула логов
Создание карты процесса из логов ✔️ ✔️ ✔️ Вывод на экран карты процесса
Проверка соответствия ✔️ ✔️ Проверка отклонений по ключевым факторам
Анализ социальных сетей ✔️ ✔️ Тип модели для исследования соц. сетей
Правила принятия решений в анализе ✔️ Визуализации каждой точки принятия решений
Визуализация исследуемого процесса ✔️ ✔️ ✔️ Возможность анимации движения объектов на карте процесса
Performance Data (Время, скорость, объём и др.) ✔️ ✔️ ✔️ Возможность анализа производительности на различных участках карты процесса
Правила для исследования отклонений ✔️ Возможность прописывать правила отклонений в бизнес-процессе для поиска отклонений в процессе работы модели
Кластеризация процесса ✔️ Возможность разделения неструктурированного процесса на отдельные множества для каждого из которых производиться построение карты процесса
Дельта-анализ ✔️ ✔️ ✔️ Возможность сравнения модели AS-IS с эталонной моделью рабочего процесса  

Данная информация была взята из статьи U. Celik, Process Mining Tools Comparison, Ноябрь 2018

Заключение.

Исходя из таблички и личного опыта использования двух инструментов: Disco и ProM, могу сказать, что первый вариант нацелен на простоту использования, где не нужно возиться с кучей параметров и не встаёт вопрос выбора алгоритма для анализа. В отличии от Disco, ProM нацелен на исследовательскую работу со стороны его пользователя, так как необходимо выбрать алгоритм для анализа, настроить не один десяток параметров, но используя именно этот инструмент, можно глубже проанализировать бизнес-процесс, соответственно понять, как устроен процесс AS-IS изнутри, а также найти больше insight’ов. На практике не было рассмотрено ПО Celonis, поэтому не стану делать выводов, что он лучше или хуже других, важно знать, что такой инструмент тоже существует на рынке продуктов для Process Mining.