Превью для статьи

Несложный API для обработки графа на Node.js. Как я подружил API на Node.js и обработку графа

Почему стоит выбрать Node.js для разработки API? Высокая производительность Node.js обеспечивает низкий уровень нагрузки на процессор благодаря асинхронной обработке запросов. Это позволяет обрабатывать большое количество параллельных запросов без затормаживания системы. Также, единая языковая среда поможет в решении проблем и даст возможность быстро найти ответы на ваши вопросы.

Превью для статьи

Нечеткое сравнение строк как метод обнаружения и исправления ошибок

Привет! Часто в работе аудитора приходится сталкиваться с задачей text mining, при выполнении которой приходится использовать множество инструментов, в том числе производить поиск ошибок в тексте и их исправление. Предлагаю разобраться с этой задачей.

Превью для статьи

Преобразование xml-поля в SQL

В посте рассматривается метод по парсингу информации из xml полей в таблицах различных баз данных в СУБД MS SQL.

Превью для статьи

Как парсить сайт в приложении Django

В посте буду парсить данные с сайта по поиску работы HeadHunter в приложении Django

Превью для статьи

Как обработать данные с помощью UDF-функции Spark

Обработку данных большого объёма можно удобно и быстро производить на кластере с помощью Spark. Но что делать, если встроенных функций не хватает? Написать свою!

Превью для статьи

Распознавание чисел в прописном виде

Всем привет! Сегодня решаем задачу по распознаванию чисел, записанных прописью, из отсканированных документов. Как известно, для обработки таких данных используется Natasha, но, когда данные недостаточно качественные, она не всегда справляется со своей задачей. В таких случаях на помощь приходит алгоритм, о котором далее пойдёт речь.

Превью для статьи

Параллельная обработка и преобразование JSON-фалов в Pandas

Структурированные данные – хорошо, а полуструктурированные – не проблема. Формат json хоть и является очень популярным, однако не очень удобен для анализа, особенно если данных много, и они разделены на отдельные файлы. Давайте разберем процесс преобразования множества json-файлов различной структуры в привычный аналитикам pandas.DataFrame.