Время прочтения: 4 мин.

Одним из основных направлений в современных методах анализа данных является Process Mining (PM), предназначенный для исследования и совершенствования бизнес-процессов и процессов в информационных системах на основе изучения логов системы – совокупности данных о выполненных операциях в системе.

PM может быть реализован как путем написания программного кода, так и использованием существующих онлайн платформ.

Согласно исследованиям компании Gartner, лидером в сегменте решений для оптимизации бизнес-процессов предприятия на основе PM второй год подряд является немецкая компания Celonis.

В нашем небольшом исследовании посмотрим, как можно реализовать несложный PM-проект с помощью онлайн-платформы Celonis и сравним полученные результаты с анализом тех же исходных данных с помощью python библиотеки pm4py.

Предметом исследования будет являться процесс обработки запросов пользователей на обслуживание на основе логов автоматизированной системы, обрабатывающей эти запросы.

SD127643797 Добавление документов 2019-01-14 11:49:42
SD127643797 Назначено в группу 2019-01-14 13:07:01
SD127643797 В работе 2019-01-14 13:07:23
SD127643797 Выполнено: решено полностью 2019-01-17 11:24:43
SD127643797 Закрыто 2019-01-18 06:47:03

Для исследования этого процесса на онлайн-платформе, заходим на сайт www.celonis.com и после несложной процедуры регистрации получаем бесплатный доступ к анализу логов процесса объемом не более 500 Мб.

После нажатия кнопки New Project, система предлагает нам загрузить наши данные в формате CSV или XLSX.

После загрузки нашего файла переходим в окно работы с данными.

Теперь нам нужно разметить нашу таблицу событий в соответствии с моделью данных Celonis, которая содержит как минимум три обязательные колонки:

Идентификатор процесса — это уникальный ключ для каждого экземпляра процесса (например, номер обращения, инцидента или задачи). В примере на следующем рисунке это колонка «CASE ID».

Активность. Это название шага в процессе – некое событие, которое нам интересно. Именно из активностей и будет состоять граф процесса (колонка «ACTIVITY NAME»).

Временная метка произошедшего события (колонка «TIMESTAMP»).

Все, что нам осталось сделать – это нажать кнопку Next и мы готовы к просмотру результатов анализа.

Ползунки в правой части позволяют регулировать детализацию визуализации процесса.

Регуляторы в левой части позволяют анализировать граф в различных разрезах.

Также возможно моделирование процесса в реальном времени (красные точки показывают состояние каждого запроса в текущий момент времени – в данном случае по состоянию на 19.03.2019).

Данный процесс также проанализирован с помощью python библиотеки pm4py.

Как и ожидалось, результаты в целом идентичны.

Вывод

Платформа Celonis позволяет оперативно проанализировать лог среднего объема (до 500 Мб) отдельно взятого процесса.

Если же нам нужно анализировать логи большего объема или совокупность нескольких процессов, то эта задача может решаться либо на платной версии этой же платформы, либо при помощи библиотеки pm4py (python).