Обработка документов Анализ данных
Картинка анонса

Ускоряем препроцессинг PDF-файлов

В работе аудитора может встретиться NLP-задача классификации большого числа PDF-файлов. Перед тем как приступить к решению этой DS-задачи необходимо получить текст. Классический совет – использовать Tesseract, предварительно преобразовав все страницы исходного PDF-файла в изображения. А если файлов тысячи? Тогда их предобработка займет неоправданно много времени. Есть решение…

Обработка документов Анализ данных
Картинка анонса

Ускоряем препроцессинг PDF-файлов

В работе аудитора может встретиться NLP-задача классификации большого числа PDF-файлов. Перед тем как приступить к решению этой DS-задачи необходимо получить текст. Классический совет – использовать Tesseract, предварительно преобразовав все страницы исходного PDF-файла в изображения. А если файлов тысячи? Тогда их предобработка займет неоправданно много времени. Есть решение…

Саморазвитие Digital skills
Картинка анонса

Нейронные сети «отбирают хлеб у гадалок»

Нейронные сети не только помогают компаниям делать процессы проще и быстрее, но и уже материализуются в самостоятельные проекты, такие как всем известная Prisma. Сейчас появляются и другие крайне интересные приложения…

Лайфхаки в аудите
Картинка анонса

Видеоурок PQ импорт из PDF в Excel

Каждый из нас в работе хоть раз сталкивался с форматом PDF. Формат популярен для чтения, но в плане редактирования с ним не очень удобно работать. Если вам необходимо использовать таблицу из PDF, то вы можете ее просто скопировать и вставить в Excel. Но не факт, что все форматирование и формулы останутся без изменений. Как избежать такой потери информации, расскажем вам в нашем видеоуроке.

Обработка документов Анализ данных
Картинка анонса

Извлечение информации из PDF

Сталкивались ли вы с ситуацией, когда для решения задачи необходимо просмотреть тысячи документов и извлечь из них лишь малую толику информации, такую как номер телефона или ФИО человека? Открыть документ, пролистать до нужной страницы и внести в Excel информацию — довольно простой и частый процесс, но он отнимает слишком много времени. О том, как автоматизировать процесс извлечения информации из pdf или скан-документов и избавить себя от рутинной работы

Machine Learning Computer vision
Картинка анонса

Как использовать AI – инструментарий для решения задач по верификации лиц на фото

ЖЕРАР! ТЫ?
Или как просто использовать AI – инструментарий для решения задач по верификации лиц на фото

Machine Learning Computer vision
Картинка анонса

Ставим «сети» на потерянные карты

Представьте, вы нашли банковскую карту. И желая помочь людям разместили фото находки в VK, Facebook и т.п…
А какую информацию мы выкладываем в интернет желая помочь? Как правило, это фото лицевой стороны карты.
Но проблема в том, что этого фото достаточно для покупки в ряде интернет магазинов. На фото есть вся необходимая информация — № карты, срок действия, имя владельца.

Machine Learning Computer vision
Картинка анонса

Кошечки против собак. «Мимишечный» DS

На данный момент в области искусственного интеллекта уже изобретено очень много. Все это кем- то запрограммировано и выложено в общий доступ. Но применяли все это только программисты, пока не появился …