Превью для статьи

Парсинг и обработка данных из сети интернет без использования программирования на примере анализа отзывов.

Рассмотрим, как можно использовать всего лишь один универсальный инструмент для полноценного процесса анализа от сбора информации до визуализации итогов в рамках конкретной задачи. В качестве такого инструмента в данном случае выступает Power BI.

Превью для статьи

IT-способ получения новостей из достоверного источника

Поток информационных новостей сыпется со всех сторон, а поиск достоверной информации становится всё затруднительнее. Для того, чтобы сделать правильный выбор необходимо опираться на первоисточник. В мире экономики и финансов одним из главных источников является Центральный Банк России. У Банка России реализован веб-сервис для получения ежедневных данных.

Превью для статьи

Ваш секретный чек-лист по парсингу

Поделюсь интересным опытом парсинга большого количества сайтов.

Превью для статьи

Парсинг сайта Единого федерального реестра сведений о банкротстве (ЕФРСБ)

Сталкиваетесь ли Вы с необходимостью использовать внешние источники данных? Если да, то Вам пригодится алгоритм автоматизированного сбора информации с сайта – парсер. Разберём процесс создания такого алгоритма на примере сайта ЕФРСБ.

Превью для статьи

Парсинг сайта ГИБДД.РФ с помощью Python + Selenium

Всем привет! Сегодня я поделюсь вариантом парсинга сайта ГИБДД, который помог мне обработать более 70 тысяч VIN номеров автомобилей с целью извлечения данных о периодах владения автомобилем.

Превью для статьи

API и ФССП: как это работает?

При проведении проверок, часто сталкиваешься с необходимостью получения данных о наличии исполнительных производств в отношении физических лиц. Поделюсь опытом написания скрипта по автоматизации работы с данными сайта ФССП.

Превью для статьи

BigARTM – тематическое моделирование на Python

Одной из задач обработки естественного языка является разделение коллекции текстов на темы, а также, выделение ключевых слов. Это делается для того, чтобы категорировать документы, например, для удобного поиска или получения общего представления о всей коллекции.
В данной статье рассказывается о библиотеке BigARTM (Python) для разделения текстов по тематикам.

Data News