Превью для статьи

Поиск ошибок в логике работы чат-бота с помощью TF-IDF и DBSCAN

На примере задачи поиска логических ошибок робота, я продемонстрирую, как методы тематического моделирования помогут исследователя при работе с большим объемом текстовых данных.

Превью для статьи

Проецирование вершин графа в векторное пространство. Часть 1

Данная публикация является 1 частью небольшого цикла, посвященного алгоритмам вложения вершин графа в векторное пространство. Конкретно сегодня расскажу об алгоритмах, основанных на матричных факторизациях. Метод излагается последовательно, опираясь на занимательную задачу поиска сообществ в графе

Превью для статьи

Снижение размерности

Всем привет! В статье рассматривается два популярных алгоритма уменьшения размерности, а именно T-distributed Stochastic Neighbor Embedding (t-SNE) и Uniform Manifold Approximation and Projection (UMAP). Их удобно использовать, когда необходимо визуализировать данные с большим количеством параметром (также будем называть это размерностью данных).

Превью для статьи

Кластеризация трасс для оценки качества процессов

Бывают такие случаи в анализе процессов, когда данных не очень много, а действия в процессах хаотичны. И что делать? Конечно, анализировать. Для этого будем использовать привычные инструменты: python и excel.