Превью для статьи

Найти всё. Text Mining

Всем добрый день! Хочу поделиться опытом анализа текста. Возьму рабочий пример документов в отношении граждан, проходящих процедуру банкротства. Задача заключается в автоматизированном сборе информации из текста 300 тыс. документов такой как: номер счета, с которого можно снять средства, разрешенная сумма, период действия. Пример интересующей меня части документа уже здесь

Превью для статьи

Даёшь огромным моделям колоссальные тренажёры

Доброе утро, друзья!
Рассмотрим систему Colossal-AI, которая представляет собой единую параллельную обучающую систему, предназначенную для плавной интеграции различных парадигм методов распараллеливания. Она позволяет исследователям данных сосредоточиться на разработке архитектуры модели и отделяет проблемы распределенного обучения от процесса разработки.

Превью для статьи

Базовые элементы автоматизации Excel с помощью Python

Порассуждаем возможно ли каким-то образом совместить гибкость и надежность Python с интуицией и удобством использования Excel?

Превью для статьи

Машинное обучение для поиска аномалий

Поиск аномалий и выявление подозрительных операций широко применяется в клиентской аналитике, банковском аудите и других видах бизнес аналитики. Суть данной методики заключается в анализе больших объемов данных и выявлении поставщиков, клиентов, транзакций или иных активностей с крайне нетипичным поведением. Часто, такие аномалии являются индикатором мошенничества или поводом для более детального анализа подобных бизнес активностей.

Превью для статьи

Terality — злой брат близнец Pandas

Добрый день, друзья. Предлагаем немного расширить арсенал инструментов для работы с данными.
Давайте разбираться.

Превью для статьи

Создай уведомления с помощью Python

Не хочешь пропустить важный момент работы твоей программы — её окончание? Решение есть!

Превью для статьи

Ансамбли методов в алгоритмах поиска выбросов

Большинство кейсов по поиску аномалий сводятся к задаче определения выбросов в данных методом k-ближайших соседей или локального уровня выбросов (LOF). Автор этого поста рассказал, как улучшить точность работы таких методов, применяя ансамбли.

Data News