Превью для статьи

Управление параметрами в Process mining при помощи фреймворка Hydra

В задачах Process Mining требуется постоянно менять входные параметры и сохранять результаты работы. При большем числе их запусков возникает потребность в отдельной системе для управления передаваемыми параметрами и логирования. В этом посте рассмотрим, как фреймворк Hydra может помочь

Превью для статьи

Визуализируем данные из xml в виде социальной сети

Вы наверняка часто слышали об XML и вам известно хотя бы одно приложение, экспортирующее данные в этот формат. XML имеет большую совместимость и благодаря этому применяется для обмена данными между базами данных и пользовательскими компьютерами. Но как именно с ним работать и анализировать? Разберу практическую задачу с экспортированными данными в XML и визуализацией этих данных

Превью для статьи

Алгоритмы для выделения ключевых слов: Rake, YAKE!, TextRank

Добрый день! Сегодня речь пойдет про алгоритмы выделения ключевых слов Rake, YAKE! И TextRank. Выделение ключевых слов становится все более актуальным с постоянным ростом объемов текстовой информации, которую необходимо каким-то образом классифицировать по тематике. Рассмотренные модели обладают интересными свойствами и преимуществами по сравнению с классическими алгоритмами, поскольку не требуют обучения.

Превью для статьи

«Как измерить графа?» или графовые метрики для аналитика

С популяризацией темы графов, графовой аналитики и их визуализации, возрастает необходимость измерять / сравнивать / выявлять зависимости и различные иерархии. На основе метрик могут быть выявлены, как мошеннические схемы и аномалии, так и изучены пути распространения информации или даже извлечены дополнительные признаки для машинного обучения.

Превью для статьи

Process Mining c bupaR

Process Mining продолжает набирать популярность и все больше применяется при поиске новых путей повышения эффективности бизнес-процессов, в оперативном анализе пилотных проектов и задачах аудита. В этом посте рассмотрим bupaR – open-source пакет для анализа бизнес-процессов на языке R. В качестве IDE использовалась RStudio.

Превью для статьи

Neo4j – графовые базы данных

Многие разработчики при выборе подходящей базы данных для своего проекта отдают предпочтение реляционным. В этой статье рассмотрим нереляционную графическую базу данных Neo4j, которая более эффективна для обработки растущего объёма подключенных данных, оптимизированную для управления отношениями. Одно из применений графовых баз данных – это продвижение рекомендаций, рекламных акций и оптимизации логистики. Эту систему на основе Neo4j используют такие компании, как ADEO, eBay и ATPCO. Рассмотрим базовый функционал и пример использования в рамках системы рекомендации.

Превью для статьи

Поиск оптимального пути для выявления отклонений в бизнес-процессе

Любая крупная компания представляет собой множество обособленных или взаимосвязанных процессов, которые решают задачи различной направленности. Как правило, любой процесс является сложным механизмом взаимодействия людей, сервисов или других компаний, от которых зависит конечный результат исполняемого процесса. Перерывы в поставках ресурсов, изъяны в сервисах и алгоритмах, длительные исполнение простых операций или их повторное выполнение и многие другие […]

Data News