Генерация паспортных данных для обучения моделей

Советуем почитать

Генерация паспортных данных для обучения моделей

Я знаю, что ты делал этой ночью

LLM'ы в преобразовании запроса на естественном языке в SQL (text2sql)

Ускоряем обучение с подкреплением на 50%

Доверительный интервал коэффициента Джини. Что это?

Создание персонажей в Python с помощью LLM: from GPT to Kandinsky

Data News

16-17 апреля 2024 года

XVI Национальная конференция ИВА «Внутренний аудит в России

26-27 июля 2024 года

PyCon Russia - конференция для python-разработчиков

Превью для статьи

01.02.2024, Кравец Максим, г. Хабаровск

Генерация паспортных данных для обучения моделей

Для тренировки нейронных сетей необходимы датасеты с достаточным количеством тренировочных данных. Зачастую в рамках разработки ML‑модели, именно составление датасета, пригодного для её обучения, занимает большую часть времени и усилий. В случае, если датасет нельзя составить из реальных данных, прибегают к генерации синтетических данных

Machine learning and neural networks Технологии аудита

Превью для статьи

25.01.2024, Коробова Марина, г. Екатеринбург

LLM’ы в преобразовании запроса на естественном языке в SQL (text2sql)

Данные занимают центральное место в информационном обществе. Именно информация является основой для принятия решений, развития бизнеса и научных исследований. Многие организации инвестируют огромные средства в системы, способные хранить, обрабатывать и анализировать данные.

Machine learning and neural networks Технологии аудита

Превью для статьи

09.01.2024, Шайдурова Арина,г. Иркутск

Создание персонажей в Python с помощью LLM: from GPT to Kandinsky

Поделюсь опытом использования больших языковых моделей (LLM) для создания персонажей с Python и моделей OpenAI и Sber.

Machine learning and neural networks Технологии аудита

Превью для статьи

21.11.2023, Котов Илья, Коробова Марина, г. Екатеринбург

Codeium и StarCoder: нейросети с автодополнением кода

В мире технологий происходит настоящая революция. На передовом фронте этой революции стоят нейронные сети — мощные и удивительные инструменты искусственного интеллекта, которые сегодня изменяют наше представление о возможностях компьютеров. Сегодня мы познакомим вас с двумя моделями-помощниками с автодополнением кода: StarCoder и Codeium.

Machine learning and neural networks Технологии аудита

Превью для статьи

28.09.2023, Рожнев Андрей, г. Иркутск

Создай, оформи, опубликуй. Sphinx — незаменимый помощник в мире Python документации

В данном посте пройдём путь от знакомства с мощным инструментом для документации Sphinx до публикации нашей собственной документации на GitHub Pages. Мы узнаем насколько широко Sphinx используется в мире открытого исходного кода, включая такие проекты как Django, The Linux Kernel, TensorFlow, Pandas и многие другие.

Web scraping и web разработка Другие технологии

Превью для статьи

26.09.2023, Абрамчук Илья, Ульянова Дарья, г. Санкт-Петербург

Генерация синтетических изображений с использованием диффузионно-трансформерной модели (DiT)

Нередко на практике, когда работаешь с алгоритмами машинного обучения, а в особенности с нейронными сетями, сталкиваешься с проблемой нехватки данных для нормального обучения модели или хотя бы получения более‑менее стабильного результата. Вот и мы оказались в подобной ситуации, решая задачу компьютерного зрения, связанную с анализом наличия нарушений в помещениях закрытого типа: нужных изображений оказалось недостаточно для качественной модели, аугментация нам не сильно помогла, а спарсить изображения из Интернета оказалось невозможно из‑за специфики данных.

Computer vision Machine learning and neural networks Другие технологии Технологии аудита

Превью для статьи

30.08.2022, Кравцов Артем,г. Екатеринбург

GAN-модели для генерации набора данных из изображений

Для машинного обучения в специфических областях очень остро стоит проблема нехватки данных для обучения. В посте рассмотрю один из способов генерировать изображения

Computer vision Технологии аудита