Пайплайн для создания классификации текстовой информации

Советуем почитать

Обработка записей разговоров на Python. Поиск пересечений в диалоге

DeepPavlov «из коробки» для задачи NLP на Python

Снижаем размерность эмбеддингов предложений для задачи определения семантического сходства

Пайплайн для создания классификации текстовой информации

Поиск ошибок в логике работы чат-бота с помощью TF-IDF и DBSCAN

Оценка качества работы систем Speech to Text

Data News

16-17 апреля 2024 года

XVI Национальная конференция ИВА «Внутренний аудит в России

26-27 июля 2024 года

PyCon Russia - конференция для python-разработчиков

Превью для статьи

13.04.2023, Дарморезов Вадим, г. Москва

Пайплайн для создания классификации текстовой информации

Актуальность работы с большими объемами текстовой информации ещё долгое время (а может быть и всегда) будет неоспорима. При этом спектр задач весьма вариативен — от задач по поиску именованных сущностей, до классификации и кластеризации текстов обрабатываемых документов.

Text mining Технологии аудита

Превью для статьи

24.11.2021, Скворцова Екатерина, г. Москва

Дисбаланс классов: как правильно провести классификацию на несбалансированной выборке

Решение задачи классификации наблюдений при явном доминировании одного класса в выборке над другим прежде всего опирается на природу дисбаланса, как обосновать применимость методов, не уйти в решение задачи поиска аномалий и верно классифицировать наблюдения рассмотрим в статье

Machine learning and neural networks Другие технологии

Превью для статьи

15.01.2021, Степанова Алена, г. Новосибирск

Ликвидация классового дисбаланса в данных. Увеличение числа примеров миноритарного класса.

Нередко возникают ситуации, когда в обучающем наборе данных доля примеров некоторого класса слишком мала. Данное явление называется классовым дисбалансом, и эта проблема в дальнейшем усложняет обучение нейронных сетей. Рассмотрим различные методы в рамках стратегии увеличения числа примеров миноритарного класса, позволяющие решить эту проблему.

Machine learning and neural networks Другие технологии

Превью для статьи

, Степанова Алена, г. Новосибирск

Ликвидация классового дисбаланса в данных. Удаление некоторого числа примеров мажоритарного класса

Подготавливаем данные для тренировки нейросети. Убираем проблему дисбаланса данных, удаляя экземпляры из класса с большим числом записей.

Machine learning and neural networks Другие технологии