Превью для статьи

Параллельная обработка и преобразование JSON-фалов в Pandas

Структурированные данные – хорошо, а полуструктурированные – не проблема. Формат json хоть и является очень популярным, однако не очень удобен для анализа, особенно если данных много, и они разделены на отдельные файлы. Давайте разберем процесс преобразования множества json-файлов различной структуры в привычный аналитикам pandas.DataFrame.

Превью для статьи

Как измерить опоссумов линейной регрессией

А что если использовать свои навыки регрессии, чтобы предсказать длину головы опоссума по остальным метриками его тела?

Превью для статьи

Ускоряем алгоритм по обработке таблиц в Python

Анонс: Всем привет! Делюсь лайфхаками по обработке таблиц с помощью нюансов использования памяти Python.

Превью для статьи

Создание кросс-таблиц

В ходе анализа данных периодически возникает потребность в их обобщении, а именно создания кросс-таблиц. Кросс-таблица — это сводная таблица, заголовки в которой могут располагаться как по строкам, так и по столбцам, позволяя отобразить взаимосвязь двух и более переменных друг с другом.
В построении таких таблиц поможет Pandas

Превью для статьи

Почему ваш pandas работает в 3000 раз медленнее?

Наверное, все пользователи pandas знают, что многие действия можно сделать разными способами. Но далеко не каждый понимает, в чем разница, и почему их код может работать более чем в 3000 раз медленнее, чем у соседа. Давайте разберемся, в чём проблема.

Превью для статьи

Исчезающие тени логистических облаков

«Умный в гору не пойдёт, умный гору обойдёт». Примерно так рассуждали DS-специалисты при решении задачи, требующей вычисления 10+ млн расстояний между парами точек по их географическим координатам.

Превью для статьи

Pandas + SQL. Обзор Python-библиотеки PandaSQL.

Pandas уже давно является неотъемлемым инструментом в арсенале любого специалиста, работающего с данными на языке Python. Ровно также неотъемлемым навыком является знание языка SQL, предназначенного для извлечения, хранения и модификации данных из реляционных баз.

Data News