
Как составить «Слово процесса»
Что первое приходит в голову, когда вы слышите о «Process mining»? Я приставляю граф процесса, состоящий из n вершин и m ребер. Для чего он нужен? думаю все и так знаю, он помогает анализировать переходы между активностями. Все это замечательно, когда активностей и переходов мало.

Pandas Groupby: Summarising, Aggregating, and Grouping data in Python
Статья про агрегацию и группировку данных с помощью pandas. В ней рассказываются особенности работы с данными:
— какие существуют агрегирующие функции
— как сделать собственную агрегирующую функцию
— как сделать результат группировки в виде фрейма
и другое.
Статья будет полезна для начинающих работать c Python и Pandas

Ускоряем Pandas при помощи модуля modin
Многим из нас знакома фраза «нет предела совершенству». В каком-то роде, python-модуль pandas можно назвать идеальным инструментом для работы с данными. Но мы попытаемся разобраться, как можно сделать это ещё более эффективно в разрезе быстродействия при использовании другого модуля modin.

Создание информативных и красивых Excel документов. XlsxWriter и Pandas
Мы постоянно работаем с excel файлами, когда выгружаем данные.
Если выгрузка является единичной — можно обойтись без применения программных средств для форматирования ячеек. Однако в иных случаях будет практичнее разобраться, каким образом автоматизировать процесс форматирования.

Лечим проблемы с памятью у Pandas: separa et impera
Как используя модуль pandas языка python можно делать пакетную (фрагментарную) обработку данных

Лечим проблемы с памятью у Pandas
Современный мир уже нельзя представить без огромных data-центров и суперкомпьютеров, которые обрабатывают колоссальные объёмы информации. Иногда владельцы такого оборудования предоставляют возможность его использовать рядовым специалистам для проведения расчётов. Но что делать, если возможность работы с такими ресурсами отсутствует, а для проведения аудиторской проверки и исследования необходимо обработать объём информации, который не помещается в оперативной памяти компьютера? В этой статье мы поделимся опытом, как используя модуль pandas можно оптимизировать объём исследуемого датасета путём преобразования типов данных

Объединение таблиц в Pandas: merge, join и concatenate
В ходе решения DA-задачи, первое, что, в большинстве случаев, необходимо выполнить – объединить множество табличных данных в большой датафрейм. Это едва ли не основной процесс, с которого начинается анализ данных и задачи машинного обучения. Зачастую данные представляют собой разрозненные файлы или данные из нескольких источников, поэтому, скорее всего, потребуется собрать всё в один датафрейм, используя некоторую логику объединения, а уже затем начать анализ.