Превью для статьи

Классификация текста с использованием моделей трансформеров

Модели трансформеров на данный момент являются state-of-the-art решениями в мире обработки естественного языка. Новые, более крупные и качественные модели появляются почти каждый месяц, устанавливая новые критерии производительности по широкому кругу задач. В данной статье мы будем использовать модель трансформера для бинарной классификации текста. Для работы с текстом существует большое количество решений. Самая простая и популярная […]

Превью для статьи

Построение интерпретируемого классификатора

Зачастую хорошие результаты в различных ds задачах дают модели, создающие векторные представления объектов обучающей выборки. Но такие модели часто становятся чёрным ящиком, в который закидываем данные и просто верим ему. Иногда этого недостаточно и хочется получать информацию о том, почему модель приняла то или иное решение. Разберем один из способов как это можно сделать на примере задачи классификации предложений

Превью для статьи

Дисбаланс классов при классификации

При решении практических задач классификации часто приходится сталкиваться с дисбалансом классов. Такая ситуация может влиять на итоговый результат модели. Хочу рассказать, как дисбаланс и его устранение отражается на результатах классификации на примере простого классификатора логистической регрессии.

Превью для статьи

Объясняем предсказания любого классификатора

Несмотря на повсеместное внедрение, модели машинного обучения часто воспринимаются как «черный ящик». Чтобы доверять модели, необходимо понимать причины, по которым она сделала то или иное предсказание. В этом посте объясним предсказания любого классификатора с помощью Python-библиотеки LIME.

Превью для статьи

Анализ тональности с помощью ruGPT-3

ruGPT-3 – крупнейшая нейросеть для русского языка. Модель представлена Sberdevices в ноябре 2020 года. ruGPT-3 демонстрирует state-of-the-art возможности для русского языка и умеет продолжать любой текст. Размер модели от 125 млн до 13 млрд параметров. Модель показывает отличные результаты без дообучения для различных типов задач, это является главной особенностью моделей типа GPT(Generate Pretrained Transformers). Более подробно можно прочитать здесь.

Превью для статьи

Adversarial Validation

Модель хорошо адаптировалась к наблюдениям из обучающего датасета, но показала плохое качество предсказания на тестовом? Расскажу о способе, который поможет заранее предусмотреть, чтобы такая проблема при обучении модели не случилась

Превью для статьи

Классификация дорожных знаков с помощью CNN

В рамках дипломного проекта, мне необходимо создать программу, которая сможет классифицировать различные дорожные знаки. За основу я возьму 3 распространённых дорожных знака, чтобы на их примере оценить работоспособность и в дальнейшем принимать решения по улучшению нейронки.

Data News