Превью для статьи

Создание и исследование лога процесса выполнения программы с помощью process mining

Анализ исходного кода — давно зарекомендовавшая себя практика для выявления отклонений до выхода приложения на рынок. Проверка на уязвимости, program understanding, поиск логических ошибок в использовании библиотек, code review и многие другие методы статического, динамического и ручного анализа кода широко применяются во многих компаниях, занимающихся разработкой программ.
Делюсь практикой исследования кода приложения, которую использовал я, для решения задачи

Превью для статьи

Управление параметрами в Process mining при помощи фреймворка Hydra

В задачах Process Mining требуется постоянно менять входные параметры и сохранять результаты работы. При большем числе их запусков возникает потребность в отдельной системе для управления передаваемыми параметрами и логирования. В этом посте рассмотрим, как фреймворк Hydra может помочь

Превью для статьи

Визуализируем данные из xml в виде социальной сети

Вы наверняка часто слышали об XML и вам известно хотя бы одно приложение, экспортирующее данные в этот формат. XML имеет большую совместимость и благодаря этому применяется для обмена данными между базами данных и пользовательскими компьютерами. Но как именно с ним работать и анализировать? Разберу практическую задачу с экспортированными данными в XML и визуализацией этих данных

Превью для статьи

Алгоритмы для выделения ключевых слов: Rake, YAKE!, TextRank

Добрый день! Сегодня речь пойдет про алгоритмы выделения ключевых слов Rake, YAKE! И TextRank. Выделение ключевых слов становится все более актуальным с постоянным ростом объемов текстовой информации, которую необходимо каким-то образом классифицировать по тематике. Рассмотренные модели обладают интересными свойствами и преимуществами по сравнению с классическими алгоритмами, поскольку не требуют обучения.

Превью для статьи

«Как измерить графа?» или графовые метрики для аналитика

С популяризацией темы графов, графовой аналитики и их визуализации, возрастает необходимость измерять / сравнивать / выявлять зависимости и различные иерархии. На основе метрик могут быть выявлены, как мошеннические схемы и аномалии, так и изучены пути распространения информации или даже извлечены дополнительные признаки для машинного обучения.

Превью для статьи

Process Mining c bupaR

Process Mining продолжает набирать популярность и все больше применяется при поиске новых путей повышения эффективности бизнес-процессов, в оперативном анализе пилотных проектов и задачах аудита. В этом посте рассмотрим bupaR – open-source пакет для анализа бизнес-процессов на языке R. В качестве IDE использовалась RStudio.

Превью для статьи

Neo4j – графовые базы данных

Многие разработчики при выборе подходящей базы данных для своего проекта отдают предпочтение реляционным. В этой статье рассмотрим нереляционную графическую базу данных Neo4j, которая более эффективна для обработки растущего объёма подключенных данных, оптимизированную для управления отношениями. Одно из применений графовых баз данных – это продвижение рекомендаций, рекламных акций и оптимизации логистики. Эту систему на основе Neo4j используют такие компании, как ADEO, eBay и ATPCO. Рассмотрим базовый функционал и пример использования в рамках системы рекомендации.

Data News