Обработка документов Анализ данных
Картинка анонса

«Расстояние Левенштейна» для анализа данных в модели

Рассмотрим стандартную ситуацию, когда аудитору для проверки гипотезы о некорректности заполнения данных в модели необходимо отобрать из огромного массива данных номера договоров, в которых, возможно, допущена ошибка при наполнении данными модель. В данной статье рассмотрим как можно использовать расстояние Левенштейна для анализа данных в модели.

Обработка документов Анализ данных
Картинка анонса

«Расстояние Левенштейна» для анализа данных в модели

Рассмотрим стандартную ситуацию, когда аудитору для проверки гипотезы о некорректности заполнения данных в модели необходимо отобрать из огромного массива данных номера договоров, в которых, возможно, допущена ошибка при наполнении данными модель. В данной статье рассмотрим как можно использовать расстояние Левенштейна для анализа данных в модели.

Анализ данных Автоматизация
Картинка анонса

React BootsTrapTable

Одним из самых распространенных элементов интерфейса для отображения данных является таблица. В этой статье расскажем о том, как работать с таблицами в React, используя специальный компонент — React Bootstrap Table, на основе которого можно создать сложные и красиво оформленные таблицы

Python Excel/PowerQuery/VBA
Картинка анонса

Обезличиваем информацию К2 в документах Excel

В предыдущей статье мы рассказали о том, как выбрать файлы, содержащие конфиденциальную информацию, для последующего их удаления с общедоступных ресурсов. Но что делать, если удаление данных, по ряду причин, невозможно? Решение данной проблемы– их обезличивание. В данной статье рассматривается один из способов защиты данных при помощи Python и COM-соединения с файлом Excel.

Обработка документов Анализ данных
Картинка анонса

Распознать сканы pdf

Распознавание с помощью библиотеки для python pytesseract от Google. Проблемы, которые могут возникнуть и способы их решения.

Обработка документов Анализ данных
Картинка анонса

Бот для конвертации ipynb файлов

В жизни любого программиста бывают ситуации, когда необходимо срочно открыть свой (или чужой) код, но компьютера под рукой нет. Расширения файлов при этом могут быть абсолютно разные, которые через телефон так просто не откроешь. Для решения этой проблемы, можно создать простой telegram-бот, которому отправляешь файл с кодом, после чего он его конвертирует в удобный формат, который легко открывается через мобильное устройство и отправляет этот файл в ответ.

Обработка документов Анализ данных
Картинка анонса

Объединение файлов с помощью Python

Как объединить несколько файлов для анализа в один, например, ежемесячные выгрузки? Напишем программу на Python, которая все будет делать автоматически.

Обработка документов Анализ данных
Картинка анонса

Заполняем PDF файлы с использованием Python: библиотека python-pptx

Каждому внутреннему аудитору приходилось хоть раз в жизни заполнять шаблоны, бланки и прочие документы. Если операция повторяется постоянно, то работу нужно автоматизировать. Сегодня расскажем о создании умного шаблона, а также об автоматизации процесса его заполнения.

Загрузить ещё