Превью для статьи

Обработка записей разговоров на Python. Поиск пересечений в диалоге

Сегодня я расскажу, как из аудиозаписи выделить разговор, вычислить его длительность и, если запись позволяет, определить пересечение диалогов с помощью библиотеки Librosa.

Превью для статьи

DeepPavlov «из коробки» для задачи NLP на Python

Как проанализировать текст в постах на habr.com? Примеры парсинга и поиск ответов на вопросы в тексте с помощью deepPavlov.

Превью для статьи

Снижаем размерность эмбеддингов предложений для задачи определения семантического сходства

С каждым годом растет сложность моделей, решающих вопросы семантически- и контекстно-ориентированной обработки естественного языка (NLP). Также нельзя забывать и про проблемы мультиязычности моделей. Все это сильно сказывается на увеличении их размеров и системных требований к железу для их обучения, дообучения, да и просто запуска. Задачи NLP сегодня – это прикладные задачи, их хочется решать на доступном оборудовании за доступное время

Превью для статьи

Пайплайн для создания классификации текстовой информации

Актуальность работы с большими объемами текстовой информации ещё долгое время (а может быть и всегда) будет неоспорима. При этом спектр задач весьма вариативен — от задач по поиску именованных сущностей, до классификации и кластеризации текстов обрабатываемых документов.

Превью для статьи

Поиск ошибок в логике работы чат-бота с помощью TF-IDF и DBSCAN

На примере задачи поиска логических ошибок робота, я продемонстрирую, как методы тематического моделирования помогут исследователя при работе с большим объемом текстовых данных.

Превью для статьи

Оценка качества работы систем Speech to Text

Привет! Передо мной стояла задача транскрибации большого количества телефонных разговоров. В этом посте расскажу об основных и альтернативных метриках качества, применяемых для оценки работы систем автоматизированного распознавания речи, а также об ошибках в распознавании слов и символов.

Превью для статьи

Мы знаем, кто под маской! Или нахождение авторского инварианта при помощи свёрточной сети

Как определить принадлежность текста автору? Ниже по ссылке кейс классификации текста с помощью нейросети и авторского инварианта