Превью для статьи

Из PDF в Excel, когда не все так просто…

Представьте ситуацию, когда вам необходимо провести комплексный анализ некоторого количества пакетов документов по определенной теме (например, различные виды договоров, счетов, актов и т.д.), при этом шаблоны документов и форматы документов в этих пакетах используются разные. В данной публикации мы предлагаем рассмотреть подходы по решению подобной задачи.

Превью для статьи

Примеры ООП на JavaScript с использованием jQuery – легко и просто! И немного Python-а. ЧАСТЬ 3

В третьей части поста я научу создавать микроweb-сервер с помощью Python, покажу на примерах, как можно передавать и получать данные от клиента к серверу, не перегружая страницы, используя JS и jQuery.

Превью для статьи

Особенности использования регулярных выражений, метода split для анализа данных в Python

В настоящее время все более востребованными в различных сферах становятся методы Data Science для анализа различных данных.
Часто перед аналитиками стоит задача проанализировать данные, которые записаны в одном столбце (например, ФИО, возраст, адрес, ИНН, дата и другие).
Разделять их вручную становится проблемой, когда таких данных очень много или присутствуют совершенно разные формулировки того или иного предложения. В таком случае помогают регулярные выражения Python.

Превью для статьи

Разделение столбца с данными на несколько с помощью Python

Сегодня мы рассмотрим, как с помощью Python разбить столбец с данными на несколько отдельных колонок.

Превью для статьи

Можно ли научить модель понимать содержание текста?

В школе каждый из нас сталкивался с пересказом текста: читаешь главу из 10 страниц, а дальше у тебя есть 5 минут, чтобы коротко изложить классу и учителю, что важного ты узнал из прочитанного. Невозможно выучить текст, как стихотворение, поэтому переработав прочитанную информацию, каждый из нас старался ее обобщить. То же самое в некотором приближении может повторить и модель машинного обучения.

Превью для статьи

Создание надстройки VSTO Word для формирования шаблонов документов. Часть 2

В каждом распоряжении всегда присутствуют дата, номер и название, но количество пунктов в тексте всегда отличается. В этой статье мы расскажем, как добавлять новые пункты одним нажатием с помощью надстройки VSTO.

Превью для статьи

Создание надстройки VSTO Word для формирования шаблонов документов. Часть 1

В организациях многие официальные документы заполняются по определенным шаблонам. Но когда появляется задача проанализировать такие документы или вытащить из них информацию для загрузки в базу данных, то это может быть довольно сложной задачей. Пользователи зачастую нарушают структуру исходного шаблона и «парсинг» файлов становится довольно проблематичным. В данной статье рассмотрим одно решение, которое поможет избежать подобных проблем.