VKCup 2020. Этап I. Как это начиналось.

Сегодня рассмотрим соревнование VkCup 2020 и задание первого отборочного этапа. Ребята из Зингера обещали, что на протяжении всех этапов будет сложно, но интересно. А что, собственно, ещё нужно? История долгого пути по дороге из жёлтого кирпича к ТОП 5 первого отборочного этапа

VKCup 2020. Этап I. Как это начиналось.

Сегодня рассмотрим соревнование VkCup 2020 и задание первого отборочного этапа. Ребята из Зингера обещали, что на протяжении всех этапов будет сложно, но интересно. А что, собственно, ещё нужно? История долгого пути по дороге из жёлтого кирпича к ТОП 5 первого отборочного этапа

Опыт решения задачи по оптимизации процесса выдачи кредитов методами Process Mining.

Продолжаем делиться практическим опытом решения задач методами Process Mining. Для погружения в данную технологию, был проведен конкурс, в ходе которого командам предстояло исследовать и оптимизировать процесс выдачи кредитов. О том, как проведен анализ читайте в нашей статье.

Кластеризация данных на примере метода к-средних

Кластеризация — подзадача Data Mining, которая группирует множество объектов на подмножество таким образом, чтобы объекты одного кластера были максимально похожи друг на друга, а объекты из разных кластеров имели максимальное количество отличных друг от друга критериев. Так в сфере аудита, кластеризация поможет определить выпадение транзакций определенного типа.

Парсер новостных RSS-лент с возможностью поиска по определенным словам

Ручной анализ новостных источников на предмет негативной или любой другой интересующей информации – дело неблагодарное и трудоемкое. Совсем другое дело, когда большое количество новостных RSS-лент можно распарсить и проанализировать с помощью c помощью библиотеки Python feedparser. Давайте рассмотрим данный функционал поподробнее.

Создаем свой RSS-агрегатор

RSS-каналы – это одна из возможностей получать информацию об обновлениях на понравившемся сайте. Их используют не только рядовые пользователи сети Интернет, но и продвинутые web-разработчики. В данной статье мы рассмотрим, как быстро настроить и отфильтровать RSS-каналы по ключевым словам, используя Python и библиотеку Feedparser. Цель – получить данные и сократить трудозатраты.

Deedle как альтернатива pandas под C#

Обработка и анализ данных. Как с помощью библиотеки Deedle получить результат аналогичный использованию метода Pandas в Python?

Снижаем размер ML модели без регистрации и смс

Любой человек, сталкивающийся с машинным обучением, понимает, что для этого требуются серьезные вычислительные мощности. В этой статье мы попробуем применить алгоритм для сжатия нейронной сети, разработанный в MIT, что позволит сократить размерность весов обучаемой модели и приведет как к ускорению обучения, так и к более быстрому запуску модели.

Загрузить ещё