Анализ данных Python
Картинка анонса

Как вырастить дерево при помощи Python.

Бывает так, что IT-сотрудник для анализа данных подключает библиотеку и бездумно использует все представленные в ней методы, совершенно не понимая, какие алгоритмы и механизмы находятся «под капотом». Поэтому в рамках этой статьи мы разберём простейший алгоритм «Дерево решений» из библиотеки sklearn, а точнее, как он работает с точки зрения математики и теории вероятностей, как алгоритм «учится», и что происходит, когда мы передаём ему данные для обучения.

Анализ данных Python
Картинка анонса

Как вырастить дерево при помощи Python.

Бывает так, что IT-сотрудник для анализа данных подключает библиотеку и бездумно использует все представленные в ней методы, совершенно не понимая, какие алгоритмы и механизмы находятся «под капотом». Поэтому в рамках этой статьи мы разберём простейший алгоритм «Дерево решений» из библиотеки sklearn, а точнее, как он работает с точки зрения математики и теории вероятностей, как алгоритм «учится», и что происходит, когда мы передаём ему данные для обучения.

Text mining Python
Картинка анонса

Инструменты для решения NER-задач для русского языка

В нашей деятельности довольно часто приходится работать с большими объемами документов, к примеру, исполнительными листами, заявлениями, договорами, из текстов которых нам зачастую необходимо извлечь весьма конкретную информацию: ФИО, даты рождения, наименования должности, паспортные данные, адрес, ИНН и наименование компаний, даты подписания документов и так далее. Всё это относится к задаче распознавания именованных сущностей (NER). Так какие инструменты могут помочь нам в решении данной задачи для русского языка?

Анализ процессов Python
Картинка анонса

Поиск оптимального пути для выявления отклонений в бизнес-процессе

Любая крупная компания представляет собой множество обособленных или взаимосвязанных процессов, которые решают задачи различной направленности. Как правило, любой процесс является сложным механизмом взаимодействия людей, сервисов или других компаний, от которых зависит конечный результат исполняемого процесса. Перерывы в поставках ресурсов, изъяны в сервисах и алгоритмах, длительные исполнение простых операций или их повторное выполнение и многие другие […]

Анализ данных Python
Картинка анонса

Многопоточная дешифровка и транскрибация записей телефонных переговоров системы NICE

В этой статье мы хотим познакомить читателей с опытом применения продукта от компании NICE Systems — системой NICE Interaction Management. Данная система обеспечивает тотальную запись разговоров, экранов и всех сопутствующих CTI-данных работы операторов контактных центров.

Python Computer vision
Картинка анонса

Реализация алгоритмов сегментации изображений с помощью библиотеки scikit-image для python

В данной статье будет рассматриваться реализация алгоритмов сегментации изображений с помощью библиотеки scikit-image для языка программирования python. В качестве примера будет показана реализация двух алгоритмов, а именно активной контурной сегментации («Змеиный алгоритм») и SLIC (Simple Linear Iterative Clustering).

Анализ данных Python
Картинка анонса

Сравнение абзацев с помощью Tensorflow_text

В данной статье я расскажу как использовать tensorflow_text для сравнения двух частей текста и определения на сколько они похожи по смыслу друг на друга.

Python Machine Learning
Картинка анонса

Градиентный бустинг с CatBoost (часть 2/3)

Продолжим разговор о CatBoost и рассмотрим Cross Validation, Overfitting Detector, ROC-AUC, SnapShot и Predict.

Загрузить ещё