Превью для статьи

Ускоряем обучение с подкреплением на 50%

Обучение с подкреплением (reinforcement learning, RL) является разделом машинного обучения, активно развивающимся направлением в искусственном интеллекте. В данном посте я хочу показать, как с помощью нехитрого трюка ускорить обучение алгоритма RL, на примере окружения игры в Gym.

Превью для статьи

Доверительный интервал коэффициента Джини. Что это?

При валидации моделей классификации иногда используется такой показатель, как «доверительный интервал коэффициента Джини». По отдельности термины «доверительный интервал» и коэффициент Джини известны и понятны. Но их сочетание может вызвать вопросы даже у специалиста, знакомого со статисткой.

Превью для статьи

Использование технологий машинного обучения в аудите: примеры эффективного применения

Аудит является неотъемлемой частью бизнес-практики, обеспечивая независимую оценку финансовой отчетности и процессов в организации. Аудиторы полагаются на опыт и статистическую выборку для ручной проверки сотен документов и свидетель-ств, определения сильных сторон и углубленного анализа организационных процедур и транзакций. Однако этот ручной процесс превратил аудит в трудоемкую и ресурсоемкую деятельность.

Превью для статьи

Использование Insightface для быстрого поиска и сравнения лиц на изображениях

Рассмотрю кейс поиска «близнецов» в паспортных данных, которые были размещены в pdf-файлах, насчитывающих десятки, а порой и сотни страниц

Превью для статьи

Codeium и StarCoder: нейросети с автодополнением кода

В мире технологий происходит настоящая революция. На передовом фронте этой революции стоят нейронные сети — мощные и удивительные инструменты искусственного интеллекта, которые сегодня изменяют наше представление о возможностях компьютеров. Сегодня мы познакомим вас с двумя моделями-помощниками с автодополнением кода: StarCoder и Codeium.

Превью для статьи

Широка, необъятна, интерактивна: оффлайн карта России с Plotly

Сегодня создание интерактивной карты на python не составляет большого труда: стоит подключить библиотеку (например, Folium или Bokeh), указать картографический сервер, и после выполнения нескольких «магических» строк кода ваши данные как на ладони!
Но что делать, если данные есть, визуализировать их хочется, а в сети, в которой вы работаете, нет доступа к картографическим серверам? В этом случае помогут Plotly и GeoPandas.

Превью для статьи

Feature engineering и кластерный анализ клиентов на PySpark

Кластеризация клиентов является важным инструментом, так как позволяет лучше понимать клиентов и предлагать им более персонализированный сервис. Также она может быть полезна для компании в поиске решения при возникновении проблем с клиентами. Побробнее в публикации.