Превью для статьи

Обработка записей разговоров на Python. Поиск пересечений в диалоге

Сегодня я расскажу, как из аудиозаписи выделить разговор, вычислить его длительность и, если запись позволяет, определить пересечение диалогов с помощью библиотеки Librosa.

Превью для статьи

Оценка качества работы систем Speech to Text

Привет! Передо мной стояла задача транскрибации большого количества телефонных разговоров. В этом посте расскажу об основных и альтернативных метриках качества, применяемых для оценки работы систем автоматизированного распознавания речи, а также об ошибках в распознавании слов и символов.

Превью для статьи

Транскрибация в облаках при поддержке панд

Представьте ситуацию: вас назначили спикером на мероприятии, и вы даже знаете, о чем хотите рассказать аудитории. Но будет ли публикой воспринят ваш доклад так, как вы себе это представляли? Давайте посмотрим, что может пойти не так, и как это исправить

Превью для статьи

Способы распознавания синтезированной речи

В современном мире стремительно развиваются технологии синтеза речи и клонирования голоса. Вместе с этим открываются новые возможности для мошенничества. Для борьбы с ним необходимо разработать инструменты распознавания искусственной речи. В публикации рассмотрю несколько новейших разработок в этой области.

Превью для статьи

Применение Yargy-парсера при переводе русскоязычных слов в числа

Проект Natasha хорошо зарекомендовал себя в решении задач NER для работы с русским языком. Он предоставляет возможности для базовой обработки текстов: сегментация на токены и предложения, морфологический и синтаксический анализы, лемматизация и, наконец, распознавание именованных сущностей – аспект, который мы подробно рассмотрим сегодня. Также будет представлено составление своих правил с помощью Yargy-парсера, что необходимо в тех случаях, когда готовые решения показывают низкое качество.

Превью для статьи

Максимально просто о распознавании речи при помощи NeMo

В лучших традициях «питоновского дзена» мы будем максимально красивы, явны, просты, в меру сложны, читаемы и даже попытаемся легко объяснить данную реализацию, что как всем известно является признаком хорошей идеи. Ах да, и это прямо сейчас, что не никогда, так сказать, все признаки хорошего материала уже на лицо, в путь.

Превью для статьи

Способы представления аудио в ML

В статье рассмотрены основные формы представления аудио для дальнейшего использования в различных сферах обработки данных.