Превью для статьи

Пайплайн для создания классификации текстовой информации

Актуальность работы с большими объемами текстовой информации ещё долгое время (а может быть и всегда) будет неоспорима. При этом спектр задач весьма вариативен — от задач по поиску именованных сущностей, до классификации и кластеризации текстов обрабатываемых документов.

Превью для статьи

Дисбаланс классов: как правильно провести классификацию на несбалансированной выборке

Решение задачи классификации наблюдений при явном доминировании одного класса в выборке над другим прежде всего опирается на природу дисбаланса, как обосновать применимость методов, не уйти в решение задачи поиска аномалий и верно классифицировать наблюдения рассмотрим в статье

Превью для статьи

Борьба с несбалансированностью классов с помощью модуля NearMiss

При построении невероятностных моделей или рассмотрении задачи классификации с большим количеством классов возникает проблема дисбаланса классов. В этой статье мы расскажем об одном из методов устранения дисбаланса классов.