Превью для статьи

Контроль за дрейфами предсказательных моделей и Popmon

В сфере бизнеса зачастую используются модели машинного обучения для прогнозирования различных показателей, однако их предсказательная сила может снижаться с течением времени. В данной публикации я расскажу, что такое дрейф моделей, почему важно следить за ними, и как это можно сделать с помощью библиотеки Popmon.

Превью для статьи

Кластеризация текста в PySpark

Текст – это не просто коллекция слов. Он содержит мысли и намерения автора. Вручную невозможно обработать огромное количество текстовой информации и понять, какие данные она может содержать. В таком случае поможет кластеризация текста.

Превью для статьи

Заставляем трансформеров отвечать на вопросы

Интеллектуальные системы призваны облегчать жизнь человека, выполняя за него рутинные задачи. Одной из таких задач является поиск информации в большом количестве текста. Возможно ли и эту задачу перенести на плечи интеллектуальных систем? Этим вопросом я решил задаться

Превью для статьи

Нечеткое сравнение строк с помощью rapidfuzz

В публикации расскажу, как при решении задачи нечеткого сравнения строк, среди разных инструментов сравнения (по косинусному сходству, по сходству Левенштейна, по сходству Джаро‑Винклера) был выбран лучший вариант нечеткого сопоставления. Сравнение инструментов производилось исходя из скорости выполнения, правильности сравнения и простоты реализации, с помощью библиотек rapidfuzz и sklearn

Превью для статьи

Sketch: искусственный интеллект на службе аналитика данных в Pandas

Всего за несколько месяцев существования чат-бот ChatGPT обрёл необычайную популярность. Пожалуй, новости, связанные с этой технологией, уже изрядно всех утомили и мало чем удивляют. Но стоит отдать должное, большое число приложений на основе языковых моделей действительно завораживает: чат-боты стали использовать буквально во всём, от создания контента до написания программного кода. С помощью библиотеки Sketch задам вопросы чат-боту, специализацией которого является работа с наборами данных Pandas, и попробую выяснить, может ли он быть полезен в реальных задачах.

Превью для статьи

Роботы-эмпаты, миф или реальность?

Нужно быстро провести UX-исследование продукта? Предобученные модели-трансформеры помогут!

Превью для статьи

Тебе не пригодится математика в колл-центре, говорили они…

Многие современные компании, чья деятельность направлена на обслуживание клиентов, стремятся поддерживать высокий уровень услуг и клиентской поддержки. Увеличение количества клиентов является одним из показателей успешности компании. Но, постоянное увеличение потока клиентов, в особенности изменение активности клиентов в зависимости от времени, может вызывать сложности в организации работы клиентской поддержки.

Data News

15 сентября 2023 года


📍CrossConf 2023