Превью для статьи

Полируем Parquet

Порой случается так, что различные данные невозможно загрузить, обработать и сохранить для передачи или дальнейшей обработки из-за их большого объема. Тем не менее эту проблему можно решить путем грамотного выбора формата их хранения.

Превью для статьи

Такие одинаковые, но такие разные: особенности реализации функции CONCAT в разных языках и СУБД

В публикации рассмотрю особенности реализации функции CONCAT в разных языках и СУБД, знание которых поможет избежать возможных ошибок в работе.

Превью для статьи

Транскрибация в облаках при поддержке панд

Представьте ситуацию: вас назначили спикером на мероприятии, и вы даже знаете, о чем хотите рассказать аудитории. Но будет ли публикой воспринят ваш доклад так, как вы себе это представляли? Давайте посмотрим, что может пойти не так, и как это исправить

Превью для статьи

LazyFrame и отсутствие индексов: чем Polars отличается от Pandas

Если вы работаете с Pandas и ничего не слышали про Polars, предлагаю познакомиться с этой библиотекой и узнать, почему её нужно добавить в арсенал инструментов для работы с данными.

Превью для статьи

Регрессия в нейросетях: предсказываем загрязнение воздуха

Эффективны ли нейросети в задачах регрессии? Обучим нейронку на данных о загрязнении воздуха и посмотрим, что из этого получится

Превью для статьи

Бамбук, Mito-лист и Деталь, или как подготовиться ко встрече с пандами

Как часто вы сталкиваетесь с необходимостью выгрузить в MS Excel более миллиона строк? Все фильтры на выгрузку уже были наложены ранее, но, увы, она до сих пор «не проходит по габаритам». Перед нами встает дилемма – делить, или … воспользоваться готовыми решениями для python, не изучая python!

Превью для статьи

Работа с нечитаемыми символами в текстовых файлах

Как прочесть текстовые файлы с нечитаемыми символами (например, смайликами) или сохраненные в разных кодировках?

Data News