Machine Learning
Картинка анонса

River – библиотека для инкрементного машинного обучения на потоковых данных

Обеспечение постоянной доступности к данным является жестким ограничением для применения машинного обучения в большинстве приложений из реального мира, где данные генерируются непрерывно.
Непрерывное обучение отлично показывает себя в задачах прогнозирования временных рядов, фильтрации спама, рекомендательных системах, прогнозировании CTR и интернете вещей. Подробнее расскажем в этой статье

Machine Learning
Картинка анонса

River – библиотека для инкрементного машинного обучения на потоковых данных

Обеспечение постоянной доступности к данным является жестким ограничением для применения машинного обучения в большинстве приложений из реального мира, где данные генерируются непрерывно.
Непрерывное обучение отлично показывает себя в задачах прогнозирования временных рядов, фильтрации спама, рекомендательных системах, прогнозировании CTR и интернете вещей. Подробнее расскажем в этой статье

Программирование
Картинка анонса

Polars: самая быстрая библиотека для обработки данных

В этой статье я хочу поделиться с вами альтернативой Pandas, которая работает в 2 раза быстрее. Polars – одна из малоизвестных библиотек, выпущенная летом 2021 года. Стоит отметить, что Polars такой быстрый за счет реализации библиотеки на языке Rust и использования Apache Arrow в качестве основы. Давайте проведем сравнение быстродействия этих двух библиотек

Саморазвитие Machine Learning
Картинка анонса

Линейная регрессия на заданном наборе данных

Друзья, известно, что линейная регрессия — это алгоритм Machine Learning, базирующийся на обучении с учителем. Регрессия моделирует целевое значение прогноза на основе независимых переменных. Алгоритм применяется для определения взаимосвязи между переменными и прогнозирования.
В этой статье я покажу, как можно использовать библиотеки Python для того, чтобы создать линейную регрессию на имеющемся заданном наборе данных. В частности, будет использована бинарная линейная модель, чтобы было проще визуализировать ее.

Pandas NLP
Картинка анонса

BigARTM – тематическое моделирование на Python

Одной из задач обработки естественного языка является разделение коллекции текстов на темы, а также, выделение ключевых слов. Это делается для того, чтобы категорировать документы, например, для удобного поиска или получения общего представления о всей коллекции.
В данной статье рассказывается о библиотеке BigARTM (Python) для разделения текстов по тематикам.

Анализ данных Pandas
Картинка анонса

От Pandas к Dask

Приходится ли Вам обрабатывать табличные данные на персональных компьютерах? Зачастую обработка таких данных выполняется с помощью Python и библиотеки Pandas.
Несмотря на удобство и широкий функционал библиотеки Pandas, обработка с её помощью больших наборов данных становится затруднительной. Преодолеть ограничения, связанные с большим объемом данных, позволяет библиотека Dask.

Анализ процессов Python
Картинка анонса

Сравнение инструментов для GRAPH MINING

Доброе утро, друзья!
В данной статье проведём сравнительный анализ инструментов для построения графа и средств визуализации

Анализ данных Python
Картинка анонса

Кластеризация клиентов. Анализ личности клиента.

В этой статье будет рассмотрена неконтролируемая кластеризация данных

Загрузить ещё