Python NLP
Картинка анонса

Морфологический анализ текста с помощью pymorphy2

Расскажем вам о способе преобразования данных сайта по словам-триггерам и о том, как это сделать максимально быстро и без значительных трудозатрат

Python NLP
Картинка анонса

Морфологический анализ текста с помощью pymorphy2

Расскажем вам о способе преобразования данных сайта по словам-триггерам и о том, как это сделать максимально быстро и без значительных трудозатрат

NLP Machine Learning
Картинка анонса

Детекция токсичных комментариев на минималках, или как жить и делать NLP, когда отобрали GPU.

В данной статье мы рассмотрим задачу выявления токсичных комментариев с приемлемым качеством и при минимальном использовании ресурсов, что может быть полезно при отсутствии мощных серверов для проведения предсказания.

NLP Machine Learning
Картинка анонса

Извлечение структурированной информации с помощью Yargy-парсера

В части задачи NER (извлечении именованных сущностей) для текстов на русском языке, многим знакома библиотека natasha, обладающая большим набором встроенных правил для извлечения отдельных типов сущностей (Адреса, Имена и т.д.) из текста. Но бывают случаи, когда необходимо создать новое уникальное правило, для извлечения данных и иметь для этого понятный и гибкий инструмент на Python. В таком случае Yargy-парсер является хорошим решением.

NLP Machine Learning
Картинка анонса

Выбор функции потерь для задач построения нейронных сетей

При построении нейронных сетей перед нами часто встаёт вопрос правильного выбора функции потерь, используемой для формирования соответствий между входными и выходными параметрами. В рамках данной статьи мы рассмотрим три функции потерь для нейросетей, решающих регрессионные задачи.

NLP Machine Learning
Картинка анонса

Построение текстовой классификации задач из системы управления проектами методами Natural language processing.

В современном мире существуют разные системы управления, которые представляют собой рабочее пространство для ведения проектов. Одной из таких систем является Jira. Система Jira помогает пользователям обмениваться информацией, отслеживать соблюдение сроков выполнения работы, а также просматривать прогресс решения задач.

NLP Machine Learning
Картинка анонса

NLP и аудит.

Начнем с идеи. Помните, я демонстрировал небольшой очерк на тему парсинга сайтов в контексте аудита? Не помните – вот ссылка: https://newtechaudit.ru/parsing-i-audit/. Представьте теперь, что данные с сайта получены и готовы к обработке. К примеру, у вас есть желание выявить негативные комментарии со страницы отзывов и предложений, собрать статистические показатели успехов рекламных кампаний, кластеризовать по темам тексты заявлений или просто подготовить контент сайта к более детальной машинной или ручной аналитике. Но что может произойти? Люди любят писать с ошибками в орфографии или пунктуации, баловаться со склонениями или злоупотреблять служебными частями речи даже в официальных документах. Это серьезная подножка работе классификаторов, кластеризаторов, аналитиков и любителей чистого русского языка. Что же делать? Приведем далее некоторые базовые методы преображения текста и его подготовки к анализу. Как это делать? Воспользуемся Python и добавим немного математики!

NLP Machine Learning
Картинка анонса

NLP: Выделяем факты из текстов с помощью Томита-парсера

Большая часть данных в мире не структурирована – это просто тексты на русском или на любом другом языке. Извлеченные факты из таких текстов могут представлять особый интерес для бизнеса, поэтому подобные задачи возникают сплошь и рядом. Этим вопросом занимается отдельное направление искусственного интеллекта: обработка естественного языка, тот самый NLP.

Загрузить ещё