SQL Java
Картинка анонса

Модели – SQL VS Java

Как строятся модели мы уже рассказывали, но при этом обошли самый популярный инструмент после excel — это SQL. Да, на нем тоже можно писать модели. И это даже очень удобно, так как в одном флаконе и доступ к данным, которые позволят обратиться и выбрать именно то, что надо. Но насколько подходит SQL для построения модели? Об этом в нашей статье.

SQL Java
Картинка анонса

Модели – SQL VS Java

Как строятся модели мы уже рассказывали, но при этом обошли самый популярный инструмент после excel — это SQL. Да, на нем тоже можно писать модели. И это даже очень удобно, так как в одном флаконе и доступ к данным, которые позволят обратиться и выбрать именно то, что надо. Но насколько подходит SQL для построения модели? Об этом в нашей статье.

Подготовка данных Python
Картинка анонса

Быстрая разметка датасета для моделей обучения с учителем

Создавая модель машинного обучения с учителем, мы часто сталкиваемся с проблемой создания размеченного набора данных — Dataset. Делимся лайфхаком по быстрой разметке датасета для моделей обучения с учителем, при помощи библиотеки PIGEON — Quickly annotate data on Jupyter

Подготовка данных Python
Картинка анонса

Предобработка данных на Python

Доброе утро!
Анализ данных является довольно сложным, увлекательным и часто требующим креативности от исполнителя процессом. Важным и первостепенным этапом проведение анализа является подготовка данных. Именно этому этапу, от которого зависит скорость, удобство, а также результат, и посвящен материал данной статьи.

Подготовка данных Machine Learning
Картинка анонса

Инструмент увеличения скорости обработки больших массивов данных

Практический пример создания клиент-серверного приложения для распознавания именованных сущностей (NER).

Подготовка данных Machine Learning
Картинка анонса

Machin Learning на C++. Легко! Ну почти…

Далеко не секрет, что в настоящее время наиболее часто для целей машинного обучения используется язык программирования Python поскольку для него разработано большое количество инструментов, предоставляющих ML-функционал. И даже, если разработчик привык писать на другом языке программирования, то при возникновении задачи, связанной с машинным обучением, с высокой долей вероятности он примет решение в пользу Python.

Подготовка данных Machine Learning
Картинка анонса

Балансировка массива для ML при недостаточном количестве миноритарных объектов в массиве.

При моделировании какого-либо процесса с помощью ML (machine learning), одной из наиболее трудоемких и ответственных задач является создание массива данных, достаточного по объему для создания модели с высокими качественными характеристиками. Что делать, если данных недостаточно?

Подготовка данных Machine Learning
Картинка анонса

Применение процессов Дирихле в машинном обучении

Доброе утро! Сегодня расскажем о процессах Дирихле в машинном обучении и улучшим данные на небольшом примере.

Загрузить ещё