Parsing. Преимущества и недостатки известных инструментов

Советуем почитать

Задача причинно-следственного вывода и ациклические направленные графы в R

Mojo… Будущий убийца Python

Оптимизация хранения данных в СУБД Greenplum

Универсальный алгоритм расчета потерь рабочего времени на Python

Квартет ML

C Новым 2023 годом!

Data News

16-17 апреля 2024 года

XVI Национальная конференция ИВА «Внутренний аудит в России

26-27 июля 2024 года

PyCon Russia - конференция для python-разработчиков

Превью для статьи

19.08.2020, Алексей Ткаченко, г. Воронеж

Parsing. Преимущества и недостатки известных инструментов

Сбор информации, особенно в аудиторской деятельности, занимает большое количество времени и сил, поэтому «ленивые» программисты создали инструмент, который облегчает им жизнь. Мы уже много рассказывали про Parsing. В этой статье мы рассмотрим преимущества и недостатки разных вариантов парсинга.

ПроАудит

Превью для статьи

26.02.2020, Максим Дейнеко, г. Иркутск

Web Parsing. Основы на Python

Рассмотрим еще один практический кейс парсинга сайтов с помощью библиотеки BeautifulSoup: что делать, если на сайте нет готовой выгрузки с данными и нет API для удобной работы, а страниц для ручного копирования очень много? Узнайте альтернативный способ извлечения информации с просторов Интернета.

ПроАудит

Превью для статьи

14.10.2021, Малышев Алексей, г. Новосибирск

Стандартизация адресов с Elasticsearch

Передо мной стояла задача сравнения большого количества адресов из разных баз данных с целью поиска совпадений. И единственным рациональным, на мой взгляд, решением было привести адреса к единому виду. Для нормализации адресов использован единый российский государственный адресный реестр — ФИАС, базы которого находятся в открытом доступе.

Databases and big data Другие технологии

Превью для статьи

17.02.2020, Денис Корнеев, г. Москва

Что такое Teradata? Её отличия от аналогов.

Teradata – разрабатывалась как система управления базами данных для распределенного хранения, и обработки данных. Сравним её, с самыми распространёнными аналогами на рынке.

ПроАудит

Превью для статьи

23.06.2022, Мананников Пётр,г. Москва

Высокие технологии для личной жизни

Добрый день, друзья. Где искать друзей по интересам или партнера для жизни? Расскажем, как с помощью программирования найти себе пару или просто будущих друзей в vk

Web scraping и web разработка Другие технологии

Превью для статьи

24.09.2019, Абрашкина Анна и Богуренко Павел. г. Самара

Как договориться с экспертами и памятью

31 августа 2019 в офисе mail.ru group прошла конференция Moscow Data Science Major. О том, какие инструменты можно использовать, каких промахов возможно избежать и как выводят модели в пром другие IT-специалисты, читайте в нашем обзоре «Как договориться с экспертами и памятью»

ПроАудит

Превью для статьи

15.05.2020, Герман Абрамов, г. Москва

Парсер новостных RSS-лент с возможностью поиска по определенным словам

Ручной анализ новостных источников на предмет негативной или любой другой интересующей информации – дело неблагодарное и трудоемкое. Совсем другое дело, когда большое количество новостных RSS-лент можно распарсить и проанализировать с помощью c помощью библиотеки Python feedparser. Давайте рассмотрим данный функционал поподробнее.

ПроАудит