Превью для статьи

Транскрибация в облаках при поддержке панд

Представьте ситуацию: вас назначили спикером на мероприятии, и вы даже знаете, о чем хотите рассказать аудитории. Но будет ли публикой воспринят ваш доклад так, как вы себе это представляли? Давайте посмотрим, что может пойти не так, и как это исправить

Превью для статьи

Инструменты для решения NER-задач для русского языка

В нашей деятельности довольно часто приходится работать с большими объемами документов, к примеру, исполнительными листами, заявлениями, договорами, из текстов которых нам зачастую необходимо извлечь весьма конкретную информацию: ФИО, даты рождения, наименования должности, паспортные данные, адрес, ИНН и наименование компаний, даты подписания документов и так далее. Всё это относится к задаче распознавания именованных сущностей (NER). Так какие инструменты могут помочь нам в решении данной задачи для русского языка?

Превью для статьи

Анализ текста средствами библиотеки Stanza

Для решения задач обработки текстов на естественном языке на сегодняшний день существует множество библиотек для python. Один из них — библиотека Stanza от StanfordNLPGroup.

Превью для статьи

Process mining текстовых чатов по сделкам с недвижимостью

Определяем логику процесса запроса документов по сделкам с недвижимостью с помощью текстовых чатов

Превью для статьи

Функция OPENJSON в SQL Server

С выходом SQL Server 2016 был реализован нативный функционал JSON. Это формат представления данных, который интерпретируется и передаётся независимо от платформы, являясь облегчённым форматом обмена данных между системами. JSON является основным конкурентом XML и с каждым годом для Web-API доля разрабатываемых систем, использующих JSON растёт.

Превью для статьи

Как найти аномальные запросы к базе данных с помощью ML

Доступ к базе данных в крупной компании – это большая ответственность. Больше данных доступно – больше информации может быть использовано в личных целях. В задачи службы внутреннего аудита также входит контроль выгружаемой информации. Как автоматизировать этот процесс? Как проверить, что пользователи не злоупотребляют своими полномочиями с помощью машинного обучения?