Транскрибация в облаках при поддержке панд

Советуем почитать

Обработка записей разговоров на Python. Поиск пересечений в диалоге

DeepPavlov «из коробки» для задачи NLP на Python

Снижаем размерность эмбеддингов предложений для задачи определения семантического сходства

Пайплайн для создания классификации текстовой информации

Поиск ошибок в логике работы чат-бота с помощью TF-IDF и DBSCAN

Оценка качества работы систем Speech to Text

Data News

16-17 апреля 2024 года

XVI Национальная конференция ИВА «Внутренний аудит в России

26-27 июля 2024 года

PyCon Russia - конференция для python-разработчиков

Превью для статьи

28.12.2022, Мананников Пётр, г. Москва

Транскрибация в облаках при поддержке панд

Представьте ситуацию: вас назначили спикером на мероприятии, и вы даже знаете, о чем хотите рассказать аудитории. Но будет ли публикой воспринят ваш доклад так, как вы себе это представляли? Давайте посмотрим, что может пойти не так, и как это исправить

Text mining Технологии аудита

Превью для статьи

28.12.2021, Ольга Сидоркина, г. Самара, Егор Сергеев, г. Нижний Новгород

Инструменты для решения NER-задач для русского языка

В нашей деятельности довольно часто приходится работать с большими объемами документов, к примеру, исполнительными листами, заявлениями, договорами, из текстов которых нам зачастую необходимо извлечь весьма конкретную информацию: ФИО, даты рождения, наименования должности, паспортные данные, адрес, ИНН и наименование компаний, даты подписания документов и так далее. Всё это относится к задаче распознавания именованных сущностей (NER). Так какие инструменты могут помочь нам в решении данной задачи для русского языка?

Text mining Технологии аудита

Превью для статьи

13.12.2021, Тетерин Александр, г. Санкт-Петербург

Анализ текста средствами библиотеки Stanza

Для решения задач обработки текстов на естественном языке на сегодняшний день существует множество библиотек для python. Один из них — библиотека Stanza от StanfordNLPGroup.

Text mining Технологии аудита

Превью для статьи

22.09.2021, Фёдорова Валентина, г. Иркутск

Process mining текстовых чатов по сделкам с недвижимостью

Определяем логику процесса запроса документов по сделкам с недвижимостью с помощью текстовых чатов

Process mining Технологии аудита

Превью для статьи

27.08.2021, Баланев Руслан, г. Хабаровск

Функция OPENJSON в SQL Server

С выходом SQL Server 2016 был реализован нативный функционал JSON. Это формат представления данных, который интерпретируется и передаётся независимо от платформы, являясь облегчённым форматом обмена данных между системами. JSON является основным конкурентом XML и с каждым годом для Web-API доля разрабатываемых систем, использующих JSON растёт.

Databases and big data Другие технологии

Превью для статьи

27.01.2021, Екатерина Скворцова г.Москва

Как найти аномальные запросы к базе данных с помощью ML

Доступ к базе данных в крупной компании – это большая ответственность. Больше данных доступно – больше информации может быть использовано в личных целях. В задачи службы внутреннего аудита также входит контроль выгружаемой информации. Как автоматизировать этот процесс? Как проверить, что пользователи не злоупотребляют своими полномочиями с помощью машинного обучения?

Machine learning and neural networks Другие технологии