Пайплайн для создания классификации текстовой информации

Советуем почитать

Обработка записей разговоров на Python. Поиск пересечений в диалоге

DeepPavlov «из коробки» для задачи NLP на Python

Снижаем размерность эмбеддингов предложений для задачи определения семантического сходства

Пайплайн для создания классификации текстовой информации

Поиск ошибок в логике работы чат-бота с помощью TF-IDF и DBSCAN

Оценка качества работы систем Speech to Text

Data News

16-17 апреля 2024 года

XVI Национальная конференция ИВА «Внутренний аудит в России

26-27 июля 2024 года

PyCon Russia - конференция для python-разработчиков

Превью для статьи

13.04.2023, Дарморезов Вадим, г. Москва

Пайплайн для создания классификации текстовой информации

Актуальность работы с большими объемами текстовой информации ещё долгое время (а может быть и всегда) будет неоспорима. При этом спектр задач весьма вариативен — от задач по поиску именованных сущностей, до классификации и кластеризации текстов обрабатываемых документов.

Text mining Технологии аудита

Превью для статьи

24.11.2021, Иоффе Яна, г. Иркутск

Обучение модели для тонального анализа.

Можно ли обучить модель понимать чувства человека? Как и зачем, давайте разберемся.

Machine learning and neural networks Другие технологии

Превью для статьи

09.08.2021, Милованов Максим, г. Новосибирск

Улучшаем время лемматизации текста для дальнейшей обработки методами NLP.

Большой объём всевозможных текстовых сообщений представляет собой интерес с точки зрения текстового анализа, однако именно их количество создаёт ряд проблем, связанных с временем которое требуется на их обработку. Даже с учётом использования методов Natural Language Processing на подготовку данных и формирование модели может уходить большое количество времени, так что полезно понимать каким образом можно повысить скорость выполнения расчётов.

Text mining Технологии аудита

Превью для статьи

03.02.2021, Кожушко Роман, г. Новосибирск

«Нормальная» подготовка текстов к ML

Доброе утро! Предлагаем сегодня поговорить о методах машинного обучения и подготовки данных.
Для работы с текстом методами ML и NLP нам нужно провести предобработку исходных данных, в частности лемматизацию. Рассмотрим различные способы и дадим рекомендации по выбору оптимального варианта.

Text mining Технологии аудита