Превью для статьи

NLP. Проект по распознаванию адресов. Natasha, Pullenti, Stanza

Многие аналитики данных сталкиваются с задачей распознавания адресов, напечатанных на документах. Я выбрал несколько самых популярных библиотек, поддерживающих русский язык, и сравнил, какую же из них использовать — Natasha, Stanza и PullEnti?

Превью для статьи

Сегментация в GreenPlum

GreenPlum является массово-параллельной (Massively Parallel Processing) СУБД, что предполагает особый подход по сравнению с традиционными (Single-Node) СУБД.Понимание особенностей реализации MPP в GreenPlum важно при создании таблиц и в особенности, при выборе способа сегментации. Например, неэффективное сегментирование может многократно снизить скорость обращения к строкам таблиц, занять больше дискового пространства чем требуется.

Превью для статьи

Сегментация экземпляров с помощью Mask R-CNN

Задача сегментации изображений может решаться в нескольких постановках. Самая распространённая — semantic segmentation с одним классом и фоном, необходимо просто отделить объекты от фона, не различая их между собой. Но часто просто отделения от фона недостаточно, необходимо отделять отдельные образцы друг от друга, например, чтобы оценить размер или расположение каждого отдельного объекта. Как это можно […]

Превью для статьи

Применение Yargy-парсера при переводе русскоязычных слов в числа

Проект Natasha хорошо зарекомендовал себя в решении задач NER для работы с русским языком. Он предоставляет возможности для базовой обработки текстов: сегментация на токены и предложения, морфологический и синтаксический анализы, лемматизация и, наконец, распознавание именованных сущностей – аспект, который мы подробно рассмотрим сегодня. Также будет представлено составление своих правил с помощью Yargy-парсера, что необходимо в тех случаях, когда готовые решения показывают низкое качество.

Превью для статьи

Реализация алгоритмов сегментации изображений с помощью библиотеки scikit-image для python

В данной статье будет рассматриваться реализация алгоритмов сегментации изображений с помощью библиотеки scikit-image для языка программирования python. В качестве примера будет показана реализация двух алгоритмов, а именно активной контурной сегментации («Змеиный алгоритм») и SLIC (Simple Linear Iterative Clustering).

Превью для статьи

Mediapipe – AI инструмент для Computer Vision

Не секрет, что задача по поиску человека на видео или фото всегда была актуальна. Но что, если один инструмент объединяет в себе, помимо просто детектирования человека, еще и поиск полной маски человеческого лица, расположение рук и пальцев, да и вообще полностью позу человека? Именно такой open-source инструмент создала всем известная компания google.

Превью для статьи

Доработка модуля поиска дат в Natasha

Не так давно мы рассматривали способы доработки библиотеки для разбиения текста на предложения, теперь же поговорим о поиске дат в этих предложениях.