Превью для статьи

DeepPavlov «из коробки» для задачи NLP на Python

Как проанализировать текст в постах на habr.com? Примеры парсинга и поиск ответов на вопросы в тексте с помощью deepPavlov.

Превью для статьи

THREADING. ЗАЧЕМ?

В данном материале рассматривается многопоточность, как один из подходов, который позволяет быстрее решать задачи, связанные с вводом-выводом, а также процесс написания парсера на его основе

Превью для статьи

Ваш секретный чек-лист по парсингу

Поделюсь интересным опытом парсинга большого количества сайтов.

Превью для статьи

Парсинг сайта Единого федерального реестра сведений о банкротстве (ЕФРСБ)

Сталкиваетесь ли Вы с необходимостью использовать внешние источники данных? Если да, то Вам пригодится алгоритм автоматизированного сбора информации с сайта – парсер. Разберём процесс создания такого алгоритма на примере сайта ЕФРСБ.

Превью для статьи

Парсинг сайта ГИБДД.РФ с помощью Python + Selenium

Всем привет! Сегодня я поделюсь вариантом парсинга сайта ГИБДД, который помог мне обработать более 70 тысяч VIN номеров автомобилей с целью извлечения данных о периодах владения автомобилем.

Превью для статьи

Анализ естественного языка (NLP)

В 1913 году ученые математики, используя ручной подсчет определили, что 43% гласных и 57% согласных содержит роман А.С. Пушкина «Евгений Онегин». Основной задачей было — построить первую модель генерирования языка и доказать, что статистические свойства языка можно моделировать. Сегодня расскажу, как, используя современные методы обработки языка, научить машину определять тематику текста.

Превью для статьи

Резюмированние текста NLP

Резюмирование текста — это метод NLP (обработка естественного языка), который извлекает текст из большого количества данных. Это помогает в создании более короткой версии имеющегося большого текста, а также: Сокращает время чтения; Помогает улучшить исследовательскую работу; Увеличивает объем информации, который может уместиться в области. Существуют методы резюмирования статей: основанный на NLP и глубокого обучения. Здесь мы рассмотрим […]