Превью для статьи

Способы распознавания синтезированной речи

В современном мире стремительно развиваются технологии синтеза речи и клонирования голоса. Вместе с этим открываются новые возможности для мошенничества. Для борьбы с ним необходимо разработать инструменты распознавания искусственной речи. В публикации рассмотрю несколько новейших разработок в этой области.

Превью для статьи

Обучение модели W2NER для поиска именованных сущностей в текстах на русском языке

Всем добрый день! Предлагаю рассмотреть архитектуру новой модели W2NER для решения задачи распознавания сущностей в текстах и обучить её работе с русским языком

Превью для статьи

Sign Language Recognition (SLR) или распознавание языка жестов

Переводим жесты в текст с помощью Long Short-Term Memory.

Превью для статьи

Анализ тональности текста с использованием фреймворка LightAutoML

При проведении аудита периодически возникают задачи анализа тональности текстов, таких как обращения клиентов. Существует множество готовых решения для определения тональности. В этой статье мы рассмотрим одно из решений, а именно LightAutoML.

Превью для статьи

Перевод любых PDF-документов в текст: с распознаванием текста на изображениях и без

В ходе исследовательских проектов с применением NLP-моделей возникает необходимость извлечь текст из всех доступных видов файлов.

Превью для статьи

Быстрая разработка прототипа HTR системы на открытых данных

В данной статье представлен способ максимально быстро получить результат используя Google Colab в качестве платформы для обучения модели HTR.

Превью для статьи

Анализ изображения с помощью фреймворка Easyocr

Easyosr — фреймворк для анализа текста с изображений с открытым кодом. За основу deep learning части данной библиотеки взята библиотека pytorch. Распознавательная часть данной библиотеки использует алгоритм craft, суть которого — обнаружение текстовой области и исследование каждой области символа, а также нахождения сходства между символами