Python NLP
Картинка анонса

Обзор токенизаторов, входящих в состав библиотеки NLTK

Одна из самых популярных на сегодняшний день python-библиотек для работы с текстами на естественном языке – NLTK (Natural Language Toolkit) – содержит большой список готовых токенизаторов.
Возникает вопрос, какой же токенизатор выбрать для решения конкретной задачи. Для ответа на него необходимо понимать, как работает тот или иной токенизатор, на какие блоки он может разбить исходный текст. В этой статье я постараюсь описать работу токенизаторов, входящих в состав NLTK, чтобы вопрос выбора стал несколько проще. Все примеры будут приведены с использованием русского языка.

Python NLP
Картинка анонса

Обзор токенизаторов, входящих в состав библиотеки NLTK

Одна из самых популярных на сегодняшний день python-библиотек для работы с текстами на естественном языке – NLTK (Natural Language Toolkit) – содержит большой список готовых токенизаторов.
Возникает вопрос, какой же токенизатор выбрать для решения конкретной задачи. Для ответа на него необходимо понимать, как работает тот или иной токенизатор, на какие блоки он может разбить исходный текст. В этой статье я постараюсь описать работу токенизаторов, входящих в состав NLTK, чтобы вопрос выбора стал несколько проще. Все примеры будут приведены с использованием русского языка.

Text mining Process mining
Картинка анонса

Text mining, как дополнение к Process mining

В последнее время всё чаще сотрудники службы внутреннего аудита анализируют с использованием инструментов Process mining процессы в деятельности компании.
Зачастую, после прохождения всех этапов Process mining и получения необходимых результатов исследования процесса, возникает резонный вопрос – каковы причины выявленных отклонений? Хорошо, если в проектной команде принимает участие специалист из подразделения владельца процесса, который на практике знаком с вопросами организации, координации и контроля деятельности исполнителей на этапах реализации процесса в компании. Что делать, если такого специалиста в команде «исследователей» нет?

Text mining Machine Learning
Картинка анонса

Text Mining. Основы нормализации текста за 5 минут

При реализации проектов, связанных с распознаванием речи, мы часто сталкиваемся с необходимостью приведения слов к его словарной форме. В этой статье мы рассмотрим начальные шаги по нормализации текста и покажем вам примеры.

Text mining Machine Learning
Картинка анонса

Мониторинг технического состояния сети

Для качественного обслуживания инфраструктуры компаний с большой филиальной сетью внедряются центры поддержки пользователей Service Desk/Help Desk. Основная их задача — регистрация заявок пользователей и предоставление требуемой помощи. Уровень качества обслуживания закрепляется между производителем услуг служб SD и их потребителями через документы SLA. Массив данных с заявками пользователей, временем и оценкой их выполнения предоставляют безграничные возможности для анализа.
В статье рассказывается о том, как, на основе комментариев заявок пользователей определить точки с самым слабым техническим состоянием.