Автоматизация, Программирование

Поиск и анализ информации, хранящейся на корпоративных порталах, при подготовке к аудиту

Время прочтения: 5 мин.

Корпоративные порталы, изначально заявленные как инструменты по управлению задачами и планированию, с течением времени становятся базой знаний и складом полезной информации: отчетов, документов, дополнений, справочной информации и т.д. На подготовительной стадии проверки оттуда можно извлечь немало данных о текущем состоянии дел подразделения. К  тому же, распределение информации, согласно заданной архитектуре (например, wiki), может сформировать удобную навигацию. Для аудитора это может быть источником информации ориентирующего характера, особенно если производственный процесс сопряжен с использованием этих сервисов. Среди интересующей информации можно найти такие сведения, как:

  • протоколы заседаний, содержащие сведения о принятии тех или иных решений;
  • дашборды – специальные инструменты для ведения интерактивных отчетов и метрик, в том числе о  текущей деятельности;
  • дорожные карты и планы по проектам;
  • согласование и рецензирование отдельных технологических разработок;
  • отчеты о проделанной деятельности;
  • бухгалтерская и иная документация;

Для ведения таких порталов могут быть использованы различные инструменты, одним из которых является Atlassian Confluence (например, на wiki-архитектуре). Сложность структуры портала и количество находящейся на нем информации обычно прямо пропорциональны количеству сотрудников, использующих Atlassian Confluence. Потому что обширное использование сотрудниками порождает накопление большого массива данных (что часто встречается в крупных корпорациях). Во время исследования могут понадобиться инструменты обработки информации, которые будут способствовать отсеиванию лишней информации и вычленению нужной. Например, инструменты поиска,  и первое, что может принести пользу – встроенный поисковый движок в Confuence.

В достаточно несложном интерфейсе расширенного поиска в Confluence можно задать критерии поиска следующими  способами:

  1. Использовать ключевые слова;
  2. Использовать фильтры;
  3. Использовать управляющие символы и логические выражения (CQL – Confluence Query Language).

Поиск по ключевым словам, в ходе сбора и анализа информации, основан на том, чтобы получить результат (отсылку к документам), содержащий слова лексикона, статистически наиболее часто встречающийся в документах  и данных, подлежащих проверки и анализу аудитором.

Перечень фильтров исчерпываемый, но они способствуют сокращению области поиска – например, можно установить временные рамки создания\изменения, отфильтровать контент по его типу: вложение,  календарь, комментарий, запись в блоге и так далее.

Использование управляющих символов позволяет задать расширенные критерии поиска, чем фильтры поискового движка. К примеру, использование “title:искомые данные” выдаст результаты, где «искомые данные» содержится в заглавии. Или при наличии сомнений в написании слова, можно использовать знак «~».

Посмотрим, как может реализовываться такой способ на практике. Используя фильтры и управляющие символы, проведем ряд поисковых экспериментов, и  посмотрим, к каким результатам мы придем.

1.Найдем произвольный документ, название которого имеет слова «План развития» или их комбинации;

  • Пусть его дата создания на портале будет в пределах прошлого полугодия (интервал ставится с помощью фильтров):
    *в поисковой строке введем (title:план развития).

Например, в списке мне попался Road map одного из продуктов с описанием поэтапного процесса разработки и выхода в эксплуатацию в 2020 году.

2. Отлично. Согласно информации в документе, процесс разработки поделен на этапы поквартально, и теперь изучив содержимое, мы уже имеем представление, какими достижениями в рамках создания продукта должно обладать подразделение (организация) на данный момент (2 квартал 2020 года) и позже. Теперь попробуем узнать о  результатах с помощью того же инструмента поиска:

  • в фильтрах проставим срок редактирования страниц, — пусть это будет 1-й квартал 2020 года;
  • в фильтрах ограничим область поиска только пространством (space – то есть тот кластер информации от всей базы, за ведение которого отвечает ограниченный круг лиц (подразделение)), на котором была обнаружена предыдущая презентация.
  • в поисковой строке введем, для начала, название продукта в заголовке документа: title:”чать”.

В результате один из первых среди результатов – документ о статусе проекта продукта, в котором отражены достигнутые результаты.

Помимо этого, можно найти исходные экземпляры официальных документов в электронном виде. Одна из таких находок получилась, когда, во время изучения пространства одного из подразделений, в адресной строке был запрос:

«(title:.doc*)» ( где * — означает что на ее месте может быть любой элемент (буква или несколько));

Среди результатов оказался Акт на разработку программного продукта с перечислениями всех технических спецификаций и условий, на которых осуществлялись прием\сдача указанных услуг,  счет.

Если условия запроса не регулировать, объем неактуальной имеющейся информации, показанной в качестве результатов запроса, может намного превысить объем искомой. Но не стоит забывать, что, при необходимости, лишнюю информацию всегда  можно отсеять подручными средствами  поискового движка, лучше прописав запрос.

Советуем почитать