Превью для статьи

Полируем Parquet

Порой случается так, что различные данные невозможно загрузить, обработать и сохранить для передачи или дальнейшей обработки из-за их большого объема. Тем не менее эту проблему можно решить путем грамотного выбора формата их хранения.

Превью для статьи

DataFrame API – придётся учить

Доброе утро, друзья!
В публикации рассмотрю примеры аналогов основных конструкций, используемых в SQL, написанных на синтаксисе Spark DataFrame.

Превью для статьи

Такие одинаковые, но такие разные: особенности реализации функции CONCAT в разных языках и СУБД

В публикации рассмотрю особенности реализации функции CONCAT в разных языках и СУБД, знание которых поможет избежать возможных ошибок в работе.

Превью для статьи

Транскрибация в облаках при поддержке панд

Представьте ситуацию: вас назначили спикером на мероприятии, и вы даже знаете, о чем хотите рассказать аудитории. Но будет ли публикой воспринят ваш доклад так, как вы себе это представляли? Давайте посмотрим, что может пойти не так, и как это исправить

Превью для статьи

Защита от парсинга: миф или реальность?

В посте рассмотрю несколько способов борьбы с «недобросовестным» парсингом.

Превью для статьи

LazyFrame и отсутствие индексов: чем Polars отличается от Pandas

Если вы работаете с Pandas и ничего не слышали про Polars, предлагаю познакомиться с этой библиотекой и узнать, почему её нужно добавить в арсенал инструментов для работы с данными.

Превью для статьи

Преобразование xml-поля в SQL

В посте рассматривается метод по парсингу информации из xml полей в таблицах различных баз данных в СУБД MS SQL.

Data News

13-14 марта 2023


📍DevOpsConf