Время прочтения: 5 мин.

Машинное обучение существует уже несколько десятилетий, хотя люди только начинают понимать его реальные возможности. Быстрое увеличение объема данных, главным образом связанное с быстрым развитием Интернета и достижениями в скорости компьютерной обработки и хранения данных, делает машинное обучение важной составляющей современной жизни. Примерами машинного обучения являются спам фильтры для электронной почты, программное обеспечение мониторинга кредитов, рекомендательные системы, используемые в целевых и рекламных целях в таких компаниях как Facebook* и Google. Машинное обучение является ключевым подмножеством искусственного интеллекта (ИИ), который возник с идеи о том, что машины можно учить таким же образом, как и людей.

Машинное обучение может стать причиной исчезновения многих профессий, не является исключением и профессия аудитора. Джон Рафаэль, директор по инновациям в Deloitte, ожидает, что машинное обучение изменит процесс работы аудиторов, поскольку улучшит соотношение между скоростью и качеством. Машинное обучения позволяет искать зависимость во всем объеме данных сразу, вместо того что бы полагаться на репрезентативные выборки. Работая с полным набором данных, аудиторы смогут выполнять свою работу более целенаправленно. Кроме того, алгоритмы машинного обучения могут «учиться» на выводах аудиторов по конкретным предметам и применять ту же логику к другим предметам со схожими характеристиками.

Технологии машинного обучения для аудита находятся в основном на этапе исследований и разработок. В этой статье объясняется, как работает машинное обучение, описывается его текущее и потенциальное влияние на профессию аудитора, а также представлены некоторые проблемы для аудиторов, которые необходимо решить, чтобы инструменты машинного обучения могли полностью раскрыть свой потенциал.

Что такое машинное обучение?

Машинное обучение — это разновидность искусственного интеллекта, которое автоматизирует построение аналитической модели. Машинное обучение использует эти модели для анализа данных, чтобы понять закономерности и сделать прогнозы. Машины запрограммированы на использование итеративного подхода к обучению на основе проанализированных данных, что делает обучение автоматизированным и непрерывным; так как данных для обучения становится все больше, распознаются устойчивые шаблоны, а обратная связь используется для изменения действий. Хотя машинное обучение и традиционный статистический анализ схожи во многих отношениях, в них существует и много различий. В то время как статистический анализ основан на теории вероятностей и распределениях вероятностей, машинное обучение предназначено для нахождения комбинации математических уравнений, которые лучше всего предсказывают результат. Таким образом, машинное обучение хорошо подходит для широкого круга задач, которые включают классификацию, линейную регрессию и кластерный анализ.

Подходы машинного обучения можно разделить на две категории: обучение с учителем и обучение без учителя. При обучении с учителем используются уже размеченные данные, таким образом предсказывается вероятность отнесения элемента к тому или иному классу. Обучение с учителем применяется, в случаях, когда на основе исторических данных прогнозируются результаты в будущем, например, для определения того, какие клиенты с наибольшей вероятностью не выполнят свои долговые обязательства. Другой категорией является обучение без учителя. В данном случае данные не размечены, а алгоритм машинного обучения самостоятельно определяет шаблоны данных. Обучение без учителя содержит различные методы, которые можно использовать для транзакционных данных (например, кластерный анализ), а так же может быть полезным при оценки рисков и нахождения ранее непредвиденных рисков.

Качество прогноза модели машинного обучения зависит от качества данных, на которых она была обучена. Так данные зависят от субъективных предубеждений человека, что может привести к тому, что какие-либо важные признаки не будут учтены при обучении или какие наборы данных будут выбраны. Так же, стоит отметить, что хоть машинное обучение и имеет огромный потенциал, но процесс обучение ограничен многими факторами, в том числе хранением и получением данных, вычислительными мощностями и т.д.

Текущее использование.

Аудиторские компании уже тестируют и изучают возможности машинного обучения в аудиторских проверках. Одним из примеров является использование компанией Deloitte Argus, инструмента машинного обучения, который может считывать информацию с таких документов, как договоры аренды, договоры купли-продажи и др. После обработки документов моделью машинного бучения аудиторы могут сосредоточиться на интерпретации ключевых характеристик документов. Нетрудно, например, представить себе машину, читающую договор аренды, определяющую ключевые термины и определяющую, является ли аренда капитальной или операционной. При правильном проектировании инструменты машинного обучения могут также выявлять закономерности и выбросы, такие как нестандартная аренда. Это позволило бы аудиторам сосредоточиться на документах с наибольшим уровнем риска, что повысит скорость и качество аудита.

Потенциальное будущее.

В будущем технология машинного обучения может позволить аудиторам обнаруживать закономерности, которые могли бы остаться незамеченными. Например, ресторан может использовать исторические финансовые данные, связанные со спутниковыми изображениями парковок, информацией о количестве гостей, полученной из систем торговых точек, и графиками работы сотрудников ресторана, получая выводы о зависимости прибыли и полученными значениями этих признаков.

Еще одним возможным использованием машинного обучения в будущем является технология распознавания лиц , которая может быть использована для определения поведения человека при собеседовании. Так, Университет штата Аризона разрабатывает программное обеспечение, которое использует распознавание лиц для выявления моделей лица, которые предполагают чрезмерную нервозность или обман во время собеседований с участниками Хотя многие финансовые компании обучают своих сотрудников тому, как проводить интервью с мошенниками, человеку трудно выявлять определенные поведенческие модели последовательно и в режиме реального времени. Использование технологии распознавания речи и распознавания лиц в интервью поможет устранить эти риски.

Задачи для аудиторов

Существует несколько преград для аудиторских фирм и регулирующих органов при использовании технологии машинного обучения в полной мере. Может быть затруднено получение данных о клиентах из внешних источников, а из-за законодательных и нормативных ограничений аудиторы, как правило, не имеют доступ к огромным хранилищам данных Google и Facebook*. Так же существуют определенные этические нормы и правила конфиденциальности, которые ограничивают доступ аудиторов к данным, необходимым для формирования обучающих наборов данных.

В случае, если все необходимые данные доступны, аудиторам необходимо проверять их целостность, полноту и точность для того, чтобы полагаться на результаты прогноза модели. Безопасность данных и целостность информации будут иметь решающее значение при определении надежности входных данных, используемых в машинном обучении. Аудиторы должны работать с экспертами по кибербезопасности, чтобы определить, защищены ли данные клиента.

Учитывая потенциальную неоднозначность используемых исходных данных и результатов, подлежащих интерпретации, стандарты аудита для инструментов машинного обучения, вероятно, должны будут измениться. Например, стандарты аналитических процедур требуют, чтобы аудитор делал определенные допущения при выполнении аналитических процедур; однако значительное преимущество машинного обучения заключается в его потенциальной способности находить уникальные или необычные отношения.

Оригинал статьи «Machine Learning in Auditing Current and Future Applications» (Gabe Dickey,  Sandra Blanke,Lloyd Seaton) читайте по ссылке

* — Признана экстремистской организацией и запрещена на территории Российской Федерации