
Text mining, как дополнение к Process mining
В последнее время всё чаще сотрудники службы внутреннего аудита анализируют с использованием инструментов Process mining процессы в деятельности компании.
Зачастую, после прохождения всех этапов Process mining и получения необходимых результатов исследования процесса, возникает резонный вопрос – каковы причины выявленных отклонений? Хорошо, если в проектной команде принимает участие специалист из подразделения владельца процесса, который на практике знаком с вопросами организации, координации и контроля деятельности исполнителей на этапах реализации процесса в компании. Что делать, если такого специалиста в команде «исследователей» нет?

Использование LDA для тематического моделирования
Читаем между строк. Text-mining для анализа обращений внутренних и внешних клиентов.

Ищем текст в документах разных форматов по ключевым словам
Построение отчётов на основании большого количества файлов – рядовая задача. Но всё становится сложнее, если вместо одного формата исходных файлов, мы получаем кучу файлов разного расширения

Ранжирование текстов по похожести на опорные тексты при помощи модели tf-idf в реализации gensim
Бывает так, что критерии поиска текстов слишком сложны, чтобы обойтись регулярными выражениями. В таких случаях на помощь приходит ML. Если из списка текстов выбрать самый подходящий для нас, можно выяснить похожесть всех остальных текстов на этот. Похожесть(similarity) это численная мера, чем выше – тем более текст похож, поэтому при сортировке по убыванию по этому параметру мы увидим наиболее подходящие нам тексты из выборки.

Text Mining. Основы нормализации текста за 5 минут
При реализации проектов, связанных с распознаванием речи, мы часто сталкиваемся с необходимостью приведения слов к его словарной форме. В этой статье мы рассмотрим начальные шаги по нормализации текста и покажем вам примеры.

Быстрая кластеризация текста с помощью Mini Batch K-means и определение оптимального K
В этой статье пойдёт речь о, наверно, самой быстрой кластеризации текста.

Мониторинг технического состояния сети
Для качественного обслуживания инфраструктуры компаний с большой филиальной сетью внедряются центры поддержки пользователей Service Desk/Help Desk. Основная их задача — регистрация заявок пользователей и предоставление требуемой помощи. Уровень качества обслуживания закрепляется между производителем услуг служб SD и их потребителями через документы SLA. Массив данных с заявками пользователей, временем и оценкой их выполнения предоставляют безграничные возможности для анализа.
В статье рассказывается о том, как, на основе комментариев заявок пользователей определить точки с самым слабым техническим состоянием.