Превью для статьи

Создание новых признаков для повышения качества машинного обучения

Существуют различные способы повышения качества работы моделей машинного обучения. Разберем по порядку

Превью для статьи

Латентное размещение Дирихле: Gensim и Scikit-Learn

Поиск поднимаемых тем в некотором множестве текстов – одна из распространенных задач в Dаtа Sсiеnсе, называемая тематическим моделированием. Одним из методов решения такой задачи является Латентное размещение Дирихле, или LDА. Самыми известными библиотеками для создания LDА моделей можно назвать Gеnsim и Sсikit-Lеаrn. В этой статье мы проведем их сравнение.

Превью для статьи

Опыт участия в DS-соревновании и описание используемых алгоритмов

Различные соревнования в области Data Science не только позволяют на практике применить имеющиеся навыки, но и мотивируют изучать для победы новые методы и алгоритмы. Зачастую решение может быть получено несколькими путями, с разной степенью оптимальности и качества. В статье я расскажу о своем опыте участия во внутреннем DS-соревновании, в ходе которого узнал и использовал нескольких различных алгоритмов решения задачи.

Превью для статьи

Про пользу развития DIGITAL навыков

Многие из нас являются аналитиками, но несмотря на все возрастающие объемы информации для анализа, еще не все стали полноценными D-people, владеющими современными навыками их обработки. Данные же ежедневно накапливаются и постепенно достигают таких размеров, что проанализировать массив обычными способами не представляется возможным. Сегодня мы расскажем о простом, но весьма полезном операторе SQL, — операторе PIVOT.

Превью для статьи

Создание гибких описаний с помощью FlexiLayout Studio

Что такое гибкие описания документов и как их создать с помощью программного обеспечения FlexiLayout Studio

Превью для статьи

Создание классификатора с помощью ABBYY FlexiCapture 12

Для чего классифицировать и как создать классификатор для распознавания .pdf документов с помощью программного обеспечения ABBYY FlexiCapture 12.

Превью для статьи

Data Science – соревнование Payment systems detection challenge для студентов

Профессиональное сообщество NewTechAudit (newtechaudit.ru) запускает Data Science – соревнование Payment systems detection challenge

Data News