Превью для статьи

«Пробенчмаркать уже это всё наконец» – тестирование инструментов для обработки данных на Python. Часть 1.

Это будет история о том, как мы придумали и приступили к реализации бенчмарка объективным, упорядоченным и унифицированным способом – через написание универсального инструмента.
В первой части публикации представим теоретическую часть задачи, предпосылки, а также первую попытку реализации универсального инструмента.

Превью для статьи

Работа с нечитаемыми символами в текстовых файлах

Как прочесть текстовые файлы с нечитаемыми символами (например, смайликами) или сохраненные в разных кодировках?

Превью для статьи

Реализация алгоритмов сегментации изображений с помощью библиотеки scikit-image для python

В данной статье будет рассматриваться реализация алгоритмов сегментации изображений с помощью библиотеки scikit-image для языка программирования python. В качестве примера будет показана реализация двух алгоритмов, а именно активной контурной сегментации («Змеиный алгоритм») и SLIC (Simple Linear Iterative Clustering).

Превью для статьи

Самостоятельная разметка данных для распознавания русского рукописного текста

В данной статье я опишу наш опыт создания датасета для обучения модели распознавания рукописного текста.
Предварительный анализ работ по этой теме показал, что в публичном доступе отсутствуют размеченные наборы данных на русском языке. Доступные данные либо описывают английский текст, либо не доступны для коммерческого использования. Нам не подходило такое условие, поэтому единственным вариантом стало создание собственных данных.

Превью для статьи

Pandas. Как изменить значения внутри Dataframe

В этой статье я расскажу о том, что означает предупреждение при работе с библиотекой Pandas: “SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame” и о том, как правильно присваивать значения внутри датафрейма.

Превью для статьи

Ускоряемся с GO

Анализ данных в эпоху нарастающей Big Data требует от инструментов всё большей производительности: уменьшение времени обработки при увеличении объёмов данных. Рассмотрим один из способов её увеличения.

Превью для статьи

GRAPH MINING для нематематиков

Всем привет! Сначала хотел назвать статью «Graph mining в 1 строчку кода», но это настолько неправдоподобно, что хочется дописать «без регистрации и СМС». Этого я делать, конечно же, не буду, поэтому решил немного переиначить смысл статьи, а заодно затронуть алгоритмы такого пугающего на первый взгляд слова как «графы».