Как извлечь таблицы из PDF-файлов.

Советуем почитать

Задача причинно-следственного вывода и ациклические направленные графы в R

Mojo… Будущий убийца Python

Оптимизация хранения данных в СУБД Greenplum

Универсальный алгоритм расчета потерь рабочего времени на Python

Квартет ML

C Новым 2023 годом!

Data News

16-17 апреля 2024 года

XVI Национальная конференция ИВА «Внутренний аудит в России

26-27 июля 2024 года

PyCon Russia - конференция для python-разработчиков

Превью для статьи

02.07.2020, Геворкьян Сергей г. Санкт-Петербург

Как извлечь таблицы из PDF-файлов.

Друзья, на сайте Newtechaudit.ru уже были представлены примеры обработки PDF-файлов с помощью Python-библиотек. Я же предлагаю сфокусироваться на более узкой задаче, которую мне пришлось решать — извлечение таблиц с данными из PDF-файлов. Я выполнил эту процедуру это в Python с помощью библиотеки Camelot. Camelot дает возможность настроить извлечение таблиц в том случае, если невозможно получить […]

ПроАудит