Превью для статьи

Web-Scraping с применением библиотек BeautifulSoup4 + Asyncio

Библиотеки BeautifulSoup4 (BS4) и Asyncio помогут ускорить извлечение данных с веб-страниц сайтов сети интернет. Подробнее в посте.

Превью для статьи

Как выявить выгодоприобретателя с помощью pandas и json

Выявить выгодоприобретателя клиента и определить дату последнего обновления сведений о нем с помощью pandas и json

Превью для статьи

Парсинг сайта Госзакупок (ЕИС закупки)

Для оценки контрагента довольно полезную информацию можно получить с сайта «ЕИС закупки», в частности из реестра недобросовестных поставщиков. Расскажу, как быстро проверить контрагентов, имея список ИНН

Превью для статьи

THREADING. ЗАЧЕМ?

В данном материале рассматривается многопоточность, как один из подходов, который позволяет быстрее решать задачи, связанные с вводом-выводом, а также процесс написания парсера на его основе

Превью для статьи

Высокие технологии для личной жизни

Добрый день, друзья. Где искать друзей по интересам или партнера для жизни? Расскажем, как с помощью программирования найти себе пару или просто будущих друзей в vk

Превью для статьи

Полезные возможности HiveQL

Всё чаще в своей работе мы используем HiveQL, который на первый взгляд ограничен возможностями SQL. В этой статье я расскажу о нескольких встроенных в Hive функциях, которые окажутся очень полезны в работе с url, xml, json и помогут сэкономить нам массу времени.
Также мы рассмотрим функцию, которая позволит более оптимально работать с join при наличии небольших таблиц.

Превью для статьи

Парсинг и обработка данных из сети интернет без использования программирования на примере анализа отзывов.

Рассмотрим, как можно использовать всего лишь один универсальный инструмент для полноценного процесса анализа от сбора информации до визуализации итогов в рамках конкретной задачи. В качестве такого инструмента в данном случае выступает Power BI.

Data News