26.08.2021, Юкельсон Лев, г. Самара Распознавание и анализ речи с помощью библиотеки Speech Recognition, pyAudio и librosa
Звуковой сигнал небольшой длительности, от пяти до 10 миллисекунд, возможно исследовать, как при стационарном процессе, выделив кепстральные коэффициенты. Эти коэффициенты, по сути, являются графиком зависимости мощности от частоты сигнала отображающегося на векторе действительных чисел. В основе систем распознавания речи стоит скрытая марковская модель, а результатом данной модели является последовательность этих векторов. О том, как распознавать и анализировать речь с помощью библиотеки Speech Recognition, pyAudio и librosa расскажем в статье.