Распознавание и анализ речи с помощью библиотеки Speech Recognition, pyAudio и librosa

Советуем почитать

NLP для поиска грамматических ошибок

Способы распознавания синтезированной речи

Максимально просто о распознавании речи при помощи NeMo

Джарвис для самых маленьких

Распознавание и анализ речи с помощью библиотеки Speech Recognition, pyAudio и librosa

Оffline распознавание речи. Библиотека Vosk

Data News

16-17 апреля 2024 года

XVI Национальная конференция ИВА «Внутренний аудит в России

26-27 июля 2024 года

PyCon Russia - конференция для python-разработчиков

Превью для статьи

26.08.2021, Юкельсон Лев, г. Самара

Распознавание и анализ речи с помощью библиотеки Speech Recognition, pyAudio и librosa

Звуковой сигнал небольшой длительности, от пяти до 10 миллисекунд, возможно исследовать, как при стационарном процессе, выделив кепстральные коэффициенты. Эти коэффициенты, по сути, являются графиком зависимости мощности от частоты сигнала отображающегося на векторе действительных чисел. В основе систем распознавания речи стоит скрытая марковская модель, а результатом данной модели является последовательность этих векторов. О том, как распознавать и анализировать речь с помощью библиотеки Speech Recognition, pyAudio и librosa расскажем в статье.

Natural Language Processing Технологии аудита

Превью для статьи

02.03.2021, Трифонов Дмитрий, г.Хабаровск

Оffline распознавание речи. Библиотека Vosk

Преобразование аудио в текст — популярная и повсеместно используемая технология. В этой статье я расскажу, как распознать речь из аудиофайла на своем ПК без использования онлайн сервисов

Natural Language Processing Технологии аудита