Анализ данных Pandas
Картинка анонса

Выгрузка таблиц по подстроке из названий колонок с помощью Spark

Как выгрузить информацию из списка таблиц по полю, зная только часть его названия? Ответ в статье.

Анализ данных Pandas
Картинка анонса

Выгрузка таблиц по подстроке из названий колонок с помощью Spark

Как выгрузить информацию из списка таблиц по полю, зная только часть его названия? Ответ в статье.

Python Pandas
Картинка анонса

Визуализация в Python. Seaborn.

Одной из важных тенденций современности выступает визуализация. Она позволяет представить информацию в более простом для понимания виде.
Существует множество инструментов для преобразования данных в графику. Один из них — библиотека Seaborn в Python, в основу которой была взята библиотека mathplotlib. Она имеет тесное взаимодействие со структурами данных Pandas и по мощности сравнима с mathplotlib. Однако функционал Seaborn шире и имеет большую абстракцию для упрощения графиков.
Архитектура этой библиотеки дает возможность быстро проанализировать нужные вам данные. Упрощение во многом позволяет создавать диаграммы, которые в полной мере соответствуют поставленным задачам.
Неоспоримое преимущество Seaborn заключается в непосредственной работе с объектами dataframe из pandas, что значительно упрощает работу.

Python Parsing / Сбор информации
Картинка анонса

Спектральный анализ временных рядов с помощью Python

С развитием информационных технологий, имея ПК и установленный на нем стандартный пакет Python, можно анализировать данные и строить на их основе прогнозы. Во многих случаях достаточно скачать библиотеку для анализа данных, и получить неплохие результаты. При этом процессы, происходящие внутри используемых пользователем библиотек, остаются за пределами внимания и, в итоге, полученные данные могут быть неправильно интерпретированы, особенно если это нейросеть.
В статье представлен пример реализации спектрального анализа функции на примере реальных данных. Этот математический метод позволяет провести более глубокий анализ изменения функции переменной во времени, найти периодические составляющие. Его применение способно существенно повлиять на результат предсказания целевой переменной, поскольку позволяет учитывать сезонные и другие периодические колебания.

Анализ данных SQL
Картинка анонса

Обзор алгоритмов интеллектуального анализа данных Microsoft Analysis Services

В настоящее время существует определенный пул Business Intelligence и Data Science инструментов, которые позволяют исследовать и визуализировать данные.

Анализ данных SQL
Картинка анонса

Как влияют аргументы поиска на производительность запросов SQL Server?

В этой статье мы будем рассматривать 2 различных запроса, в которых индексы не используются оптимизатором, но могут быть использованы, если изменить запрос. Далее будет описание механизма работы TSQL, и почему небольшое изменение кода даст положительный эффект. Наконец, мы выполним настройку запросов в SQL Server, чтобы увидеть, насколько можно улучшить производительность.

Sklearn Pandas
Картинка анонса

Методы Pandas и Scikit-learn для подготовки данных

При подготовке структурированных данных использование языка программирования Python и в частности применение методов библиотек Pandas и Scikit-learn – это один из способов успешного решения такой задачи для Data Science специалиста.

Python Java
Картинка анонса

Использование jug в анализе данных

В этой статье расскажем о применении пакета jug в Python для создания конвейера задач, позволяющего избавиться от проведения вычислений при каждом запуске программного кода.

Загрузить ещё