Превью для статьи

Использование технологий машинного обучения в аудите: примеры эффективного применения

Аудит является неотъемлемой частью бизнес-практики, обеспечивая независимую оценку финансовой отчетности и процессов в организации. Аудиторы полагаются на опыт и статистическую выборку для ручной проверки сотен документов и свидетель-ств, определения сильных сторон и углубленного анализа организационных процедур и транзакций. Однако этот ручной процесс превратил аудит в трудоемкую и ресурсоемкую деятельность.

Превью для статьи

Оценка гетерогенного эффекта воздействия посредством Causal Random Forest и визуализация эффекта

Всем привет! В данном материале рассматривается расчет CATE посредством «причинных» случайных лесов с помощью библиотеки EconML, а также визуализация результатов посредством библиотеки SHAP в Python.

Превью для статьи

Прогнозируем реальные вероятности

Может ли модель прогнозировать реальные вероятности? На самом деле абсолютно точно это не может делать ни одна. Можно максимально приблизиться к реальным показателям, но для этого модель должна быть откалибрована (скорректирована так, чтобы полученные показатели распределения вероятностей были как можно ближе к реальным). Так как откалибровать модель?

Превью для статьи

Java – темный случайный лес

Про решающие деревья уже писали и на JAVA их показывали. При этом все знают деревья сами по себе работают, мягко говоря, не очень. Поэтому, зачем нужно одно плохое дерево, если есть отличный лес. Про лес мы сегодня и расскажем. Конечно, тут может быть ремарка, что «про это уже сто раз рассказывали» – да, но это будет рассказ про лес на JAVA.

Превью для статьи

Отбор признаков в задачах машинного обучения. Статистические методы

Часто наборы данных, с которыми приходится работать, содержат большое количество признаков, число которых может достигать нескольких сотен и даже тысяч. При построении модели машинного обучения не всегда понятно, какие из признаков действительно для неё важны (т.е. имеют связь с целевой переменной), а какие являются избыточными (или шумовыми). В данной статье мы рассмотрим статистические методы отбора признаков в задачах машинного обучения.