Обработка документов Анализ данных
Картинка анонса

Как извлечь таблицы из PDF-файлов.

Друзья, на сайте Newtechaudit.ru уже были представлены примеры обработки PDF-файлов с помощью Python-библиотек. Я же предлагаю сфокусироваться на более узкой задаче, которую мне пришлось решать — извлечение таблиц с данными из PDF-файлов. Я выполнил эту процедуру это в Python с помощью библиотеки Camelot. Camelot дает возможность настроить извлечение таблиц в том случае, если невозможно получить […]