Обработка записей разговоров на Python. Поиск пересечений в диалоге

Советуем почитать

Обработка записей разговоров на Python. Поиск пересечений в диалоге

DeepPavlov «из коробки» для задачи NLP на Python

Снижаем размерность эмбеддингов предложений для задачи определения семантического сходства

Пайплайн для создания классификации текстовой информации

Поиск ошибок в логике работы чат-бота с помощью TF-IDF и DBSCAN

Оценка качества работы систем Speech to Text

Data News

16-17 апреля 2024 года

XVI Национальная конференция ИВА «Внутренний аудит в России

26-27 июля 2024 года

PyCon Russia - конференция для python-разработчиков

Превью для статьи

12.09.2023, Ермакович Максим,г. Нижний Новгород

Обработка записей разговоров на Python. Поиск пересечений в диалоге

Сегодня я расскажу, как из аудиозаписи выделить разговор, вычислить его длительность и, если запись позволяет, определить пересечение диалогов с помощью библиотеки Librosa.

Text mining Технологии аудита

Превью для статьи

13.03.2023, Константин Жевнеров, г. Воронеж

Оценка качества работы систем Speech to Text

Привет! Передо мной стояла задача транскрибации большого количества телефонных разговоров. В этом посте расскажу об основных и альтернативных метриках качества, применяемых для оценки работы систем автоматизированного распознавания речи, а также об ошибках в распознавании слов и символов.

Text mining Технологии аудита

Превью для статьи

28.12.2022, Мананников Пётр, г. Москва

Транскрибация в облаках при поддержке панд

Представьте ситуацию: вас назначили спикером на мероприятии, и вы даже знаете, о чем хотите рассказать аудитории. Но будет ли публикой воспринят ваш доклад так, как вы себе это представляли? Давайте посмотрим, что может пойти не так, и как это исправить

Text mining Технологии аудита

Превью для статьи

22.12.2022, Петрова Елизавета,г. Санкт-Петербург

Способы распознавания синтезированной речи

В современном мире стремительно развиваются технологии синтеза речи и клонирования голоса. Вместе с этим открываются новые возможности для мошенничества. Для борьбы с ним необходимо разработать инструменты распознавания искусственной речи. В публикации рассмотрю несколько новейших разработок в этой области.

Natural Language Processing Технологии аудита

Превью для статьи

30.03.2022, Никита Стокалюк, г. Ростов-на-Дону

Применение Yargy-парсера при переводе русскоязычных слов в числа

Проект Natasha хорошо зарекомендовал себя в решении задач NER для работы с русским языком. Он предоставляет возможности для базовой обработки текстов: сегментация на токены и предложения, морфологический и синтаксический анализы, лемматизация и, наконец, распознавание именованных сущностей – аспект, который мы подробно рассмотрим сегодня. Также будет представлено составление своих правил с помощью Yargy-парсера, что необходимо в тех случаях, когда готовые решения показывают низкое качество.

Text mining Технологии аудита

Превью для статьи

21.03.2022, Абрамчук Илья, г. Санкт-Петербург

Максимально просто о распознавании речи при помощи NeMo

В лучших традициях «питоновского дзена» мы будем максимально красивы, явны, просты, в меру сложны, читаемы и даже попытаемся легко объяснить данную реализацию, что как всем известно является признаком хорошей идеи. Ах да, и это прямо сейчас, что не никогда, так сказать, все признаки хорошего материала уже на лицо, в путь.

Natural Language Processing Технологии аудита

Превью для статьи

26.01.2022, Нецепляев Денис, г. Ростов-на-Дону

Способы представления аудио в ML

В статье рассмотрены основные формы представления аудио для дальнейшего использования в различных сферах обработки данных.

Machine learning and neural networks Другие технологии