Python Machine Learning
Картинка анонса

Топ 8 «потайных» библиотек Python для ML в 2021 году

Python – один из самых часто используемых при машинном обучении языков программирования. На данный момент насчитывается более 137 000 библиотек и 198 000 пакетов, применяемых в данной области. В сообществе DataScientist-ов наиболее популярны pandas, NumPy – для манипуляций с данными, matplotlib, seaborn, plotpy – для визуализации данных, scikit-learn, TensorFlow – для разработки моделей. Однако, в этой статье мы расскажем о малоизвестных в мире DS библиотеках.

Python Machine Learning
Картинка анонса

Топ 8 «потайных» библиотек Python для ML в 2021 году

Python – один из самых часто используемых при машинном обучении языков программирования. На данный момент насчитывается более 137 000 библиотек и 198 000 пакетов, применяемых в данной области. В сообществе DataScientist-ов наиболее популярны pandas, NumPy – для манипуляций с данными, matplotlib, seaborn, plotpy – для визуализации данных, scikit-learn, TensorFlow – для разработки моделей. Однако, в этой статье мы расскажем о малоизвестных в мире DS библиотеках.

Python Machine Learning
Картинка анонса

Сравнение различных видов ML классификаторов в задаче распознавания сигналов

Задача состоит в классификации гидроакустических сигналов. Сонары (гидролокаторы) посылают звук высокой частоты в определенном направлении и получают отраженную звуковую волну. По характеристике этой волны можно сделать вывод, от чего именно она отразилась – от морской мины или же от подводного камня, скалы. Используемый для решения задачи набор данных был разработан сотрудником аэрокосмического технологического центра Полом Горманом в разгар холодной войны. Для получения данных металлический цилиндр и цилиндрическая горная порода, оба длиной около 1,5 метров, размещались на песчаном дне океана.

Machine Learning
Картинка анонса

Распознавание цифр написанных от руки с помощью Machine Learning

Каждый день люди сталкиваются с огромным количеством данных, но, несмотря на переход к электронному документообороту, встречаются документы, которые отсканированы человеком и содержат рукописный текст, в том числе цифры, даты, подписи и пр.
Распознавание рукописного текста – это огромная проблема, так как существует всего 10 цифр, а почерк человека может сильно варьироваться и порой с задачей распознания рукописного текста не справляется даже сам человек, что уж говорить о почерке врача 😊
Классификация рукописного текста или цифр очень важна на практике, это поможет сократить время на разбор огромного количества данных.
В этой статье я хочу рассмотреть распознавание рукописных цифр от 0 до 9, с использованием известного набора данных digits библиотеки Scikit-learn, применяя классификатор логистической регрессии.

Подготовка данных Machine Learning
Картинка анонса

Балансировка массива для ML при недостаточном количестве миноритарных объектов в массиве.

При моделировании какого-либо процесса с помощью ML (machine learning), одной из наиболее трудоемких и ответственных задач является создание массива данных, достаточного по объему для создания модели с высокими качественными характеристиками. Что делать, если данных недостаточно?

NLP Machine Learning
Картинка анонса

Анализ сообщений коммерческого чата на предмет игнорирования вопроса клиента на основе модели NLP

В этой статье расскажем о методе извлечения информации из текстовых сообщений чата компании. Посмотрим высоко-рисковые чаты, которые содержат случаи игнорирования клиентов и требуют дополнительного анализа и решений. Применим одну из моделей NLP

NLP Machine Learning
Картинка анонса

Stanza и решение задачи NER

Доброе утро!
Сегодня расскажем о библиотеке анализа естественного языка Stanza от Stanford NLP Group, предоставляющую превосходный инструментарий для решения задачи NER по распознаванию именованных сущностей в тексте — имён людей, названий населённых пунктов, организаций, дат и т.д.

Python Machine Learning
Картинка анонса

Банкоматы и Метро

Как связаны банкоматы и станции Метро? Найдем эту связь, используя методы Machine Learning.

Загрузить ещё