Превью для статьи

Пайплайн для создания классификации текстовой информации

Актуальность работы с большими объемами текстовой информации ещё долгое время (а может быть и всегда) будет неоспорима. При этом спектр задач весьма вариативен — от задач по поиску именованных сущностей, до классификации и кластеризации текстов обрабатываемых документов.

Превью для статьи

Обучение модели для тонального анализа.

Можно ли обучить модель понимать чувства человека? Как и зачем, давайте разберемся.

Превью для статьи

Улучшаем время лемматизации текста для дальнейшей обработки методами NLP.

Большой объём всевозможных текстовых сообщений представляет собой интерес с точки зрения текстового анализа, однако именно их количество создаёт ряд проблем, связанных с временем которое требуется на их обработку. Даже с учётом использования методов Natural Language Processing на подготовку данных и формирование модели может уходить большое количество времени, так что полезно понимать каким образом можно повысить скорость выполнения расчётов.

Превью для статьи

«Нормальная» подготовка текстов к ML

Доброе утро! Предлагаем сегодня поговорить о методах машинного обучения и подготовки данных.
Для работы с текстом методами ML и NLP нам нужно провести предобработку исходных данных, в частности лемматизацию. Рассмотрим различные способы и дадим рекомендации по выбору оптимального варианта.