Text mining Machine Learning
Картинка анонса

Ранжирование текстов по похожести на опорные тексты при помощи модели tf-idf в реализации gensim

Бывает так, что критерии поиска текстов слишком сложны, чтобы обойтись регулярными выражениями. В таких случаях на помощь приходит ML. Если из списка текстов выбрать самый подходящий для нас, можно выяснить похожесть всех остальных текстов на этот. Похожесть(similarity) это численная мера, чем выше – тем более текст похож, поэтому при сортировке по убыванию по этому параметру мы увидим наиболее подходящие нам тексты из выборки.

Text mining Machine Learning
Картинка анонса

Ранжирование текстов по похожести на опорные тексты при помощи модели tf-idf в реализации gensim

Бывает так, что критерии поиска текстов слишком сложны, чтобы обойтись регулярными выражениями. В таких случаях на помощь приходит ML. Если из списка текстов выбрать самый подходящий для нас, можно выяснить похожесть всех остальных текстов на этот. Похожесть(similarity) это численная мера, чем выше – тем более текст похож, поэтому при сортировке по убыванию по этому параметру мы увидим наиболее подходящие нам тексты из выборки.

Text mining Machine Learning
Картинка анонса

Text Mining. Основы нормализации текста за 5 минут

При реализации проектов, связанных с распознаванием речи, мы часто сталкиваемся с необходимостью приведения слов к его словарной форме. В этой статье мы рассмотрим начальные шаги по нормализации текста и покажем вам примеры.

Нейронные сети Machine Learning
Картинка анонса

Подбор гиперпараметров ML-модели с помощью Hyperopt

В машинном обучении гиперпараметрами называют параметры модели, значения которых устанавливаются перед запуском процесса её обучения. Ими могут быть, как параметры самого алгоритма, например, глубина дерева в random forest, число соседей в knn, веса нейронов в нейронный сетях, так и способы обработки признаков, пропусков и т.д. Они используются для управления процессом обучения, поэтому подбор оптимальных гиперпараметров – очень важный этап в построении ML-моделей, позволяющий повысить точность, а также бороться с переобучением.

Machine Learning
Картинка анонса

Студия машинного обучения Microsoft Azure

Нередко для построения бизнес-аналитики, а также для использования моделей в пользовательских веб-приложениях требуется инструмент, который был бы прост в использовании для всех, но при этом давал исчерпывающий функционал в области прогнозного анализа данных. В последнее время появляется все больше таких решений, одно из которых хотелось бы осветить сегодня — Студия машинного обучения Microsoft Azure.

Нейронные сети Machine Learning
Картинка анонса

Python: простейший голосовой помощник

Хотите написать своего чат-бота или голосового помощника, но не знаете с чего начать? Узнайте подробнее в статье

SQL Machine Learning
Картинка анонса

Машинное обучение в среде SQL Server

Проблема обработки и анализа данных, в современных условиях, стоит особо остро на фоне их всё возрастающего роста. Качественная и количественная избыточность информации способствует выходу на рынок комплексных решений. Как, например, SQL Server, о котором пойдет речь

Machine Learning Computer vision
Картинка анонса

Использование Computer Vision при обнаружении корпоративного мошенничества

Представь себе ситуацию, когда вы — руководитель подразделения и ваши сотрудники начали подворовывать деньги из кассы, несмотря на роботизацию процессов обработки наличных денежных средств. Вам постоянно приходится проводить расследования по каждому факту недостачи, отвлекая от текущей работы сотрудников безопасности, аудиторов и иных специалистов, просматривать гигабайты видео с камер видеонаблюдения, а результатов нет.

Загрузить ещё