Анализ данных Pandas
Картинка анонса

Простое эконометрическое прогнозирование.

Сегодня в статье рассмотрим создание простой прогнозной модели на основе линейного тренда с помощью эконометрических методов.

Анализ данных Pandas
Картинка анонса

Простое эконометрическое прогнозирование.

Сегодня в статье рассмотрим создание простой прогнозной модели на основе линейного тренда с помощью эконометрических методов.

Python Pandas
Картинка анонса

Pandas: работа с неструктурированными файлами.

Очень часто аналитики сталкиваются с неструктурированными файлами, которые необходимо обработать и проанализировать. Обычно базовых функциональных возможностей MS Excel хватает для выполнения подобных задач. Но что делать, если уровень обработки файла выходит за рамки этих возможностей? Ответ прост – использовать Python и библиотеку pandas, которая предназначена для обработки и анализа данных.

Python Pandas
Картинка анонса

Создаем отчеты для моделей машинного обучения с evidently

Evidently помогает оценивать и контролировать модели в производственной среде. Сегодня я расскажу как создать такой отчет.

Классификация Pandas
Картинка анонса

Алгоритмы поиска схожих объектов в рекомендательных системах

«Досмотрю вот это видео на YouTube и пойду спать! Ой, в рекомендациях еще одно интересное. Сон, прости…». «Закажу в IKEA только стулья. Ах, сайт показал мне еще посуду, постельное белье и новую кухню в сборке. Когда там следующая зарплата?». «Бесконечный плейлист любимых музыкальных жанров в СберЗвуке заряжает меня позитивом! Как специалистам удается создавать выборку специально для меня?».

Анализ данных Pandas
Картинка анонса

Выгрузка таблиц по подстроке из названий колонок с помощью Spark

Как выгрузить информацию из списка таблиц по полю, зная только часть его названия? Ответ в статье.

Python Pandas
Картинка анонса

Визуализация в Python. Seaborn.

Одной из важных тенденций современности выступает визуализация. Она позволяет представить информацию в более простом для понимания виде.
Существует множество инструментов для преобразования данных в графику. Один из них — библиотека Seaborn в Python, в основу которой была взята библиотека mathplotlib. Она имеет тесное взаимодействие со структурами данных Pandas и по мощности сравнима с mathplotlib. Однако функционал Seaborn шире и имеет большую абстракцию для упрощения графиков.
Архитектура этой библиотеки дает возможность быстро проанализировать нужные вам данные. Упрощение во многом позволяет создавать диаграммы, которые в полной мере соответствуют поставленным задачам.
Неоспоримое преимущество Seaborn заключается в непосредственной работе с объектами dataframe из pandas, что значительно упрощает работу.

Sklearn Pandas
Картинка анонса

Методы Pandas и Scikit-learn для подготовки данных

При подготовке структурированных данных использование языка программирования Python и в частности применение методов библиотек Pandas и Scikit-learn – это один из способов успешного решения такой задачи для Data Science специалиста.

Загрузить ещё