Превью для статьи

Обработка записей разговоров на Python. Поиск пересечений в диалоге

Сегодня я расскажу, как из аудиозаписи выделить разговор, вычислить его длительность и, если запись позволяет, определить пересечение диалогов с помощью библиотеки Librosa.

Превью для статьи

Способы представления аудио в ML

В статье рассмотрены основные формы представления аудио для дальнейшего использования в различных сферах обработки данных.

Превью для статьи

Распознавание и анализ речи с помощью библиотеки Speech Recognition, pyAudio и librosa

Звуковой сигнал небольшой длительности, от пяти до 10 миллисекунд, возможно исследовать, как при стационарном процессе, выделив кепстральные коэффициенты. Эти коэффициенты, по сути, являются графиком зависимости мощности от частоты сигнала отображающегося на векторе действительных чисел. В основе систем распознавания речи стоит скрытая марковская модель, а результатом данной модели является последовательность этих векторов. О том, как распознавать и анализировать речь с помощью библиотеки Speech Recognition, pyAudio и librosa расскажем в статье.

Превью для статьи

Использование технологии CUDA в решении прикладных задач

Поговорим о прикладных вычислениях, с которыми мы регулярно сталкиваемся в задачах: бинарная и многоклассовая классификация, кластеризация, линейная алгебра, визуализация и другие. Все эти задачи обсчитываются в основном с помощью CPU. Но существуют также задачи, которые используют GPU для расчетов. К таким задачам можно отнести рендеринг видео, ретушь фотографий, загрузка текстур в видеоиграх.