Codeium и StarCoder: нейросети с автодополнением кода

Советуем почитать

Генерация паспортных данных для обучения моделей

Я знаю, что ты делал этой ночью

LLM'ы в преобразовании запроса на естественном языке в SQL (text2sql)

Ускоряем обучение с подкреплением на 50%

Доверительный интервал коэффициента Джини. Что это?

Создание персонажей в Python с помощью LLM: from GPT to Kandinsky

Data News

16-17 апреля 2024 года

XVI Национальная конференция ИВА «Внутренний аудит в России

26-27 июля 2024 года

PyCon Russia - конференция для python-разработчиков

Превью для статьи

21.11.2023, Котов Илья, Коробова Марина, г. Екатеринбург

Codeium и StarCoder: нейросети с автодополнением кода

В мире технологий происходит настоящая революция. На передовом фронте этой революции стоят нейронные сети — мощные и удивительные инструменты искусственного интеллекта, которые сегодня изменяют наше представление о возможностях компьютеров. Сегодня мы познакомим вас с двумя моделями-помощниками с автодополнением кода: StarCoder и Codeium.

Machine learning and neural networks Технологии аудита

Превью для статьи

20.07.2023, Кухтенко Андрей, Кравец Максим, Сиянов Артем,г. Хабаровск

Кластеризация текста в PySpark

Текст – это не просто коллекция слов. Он содержит мысли и намерения автора. Вручную невозможно обработать огромное количество текстовой информации и понять, какие данные она может содержать. В таком случае поможет кластеризация текста.

Machine learning and neural networks Другие технологии

Превью для статьи

15.06.2023, Черниговский Антон, г. Екатеринбург

Нечеткое сравнение строк с помощью rapidfuzz

В публикации расскажу, как при решении задачи нечеткого сравнения строк, среди разных инструментов сравнения (по косинусному сходству, по сходству Левенштейна, по сходству Джаро‑Винклера) был выбран лучший вариант нечеткого сопоставления. Сравнение инструментов производилось исходя из скорости выполнения, правильности сравнения и простоты реализации, с помощью библиотек rapidfuzz и sklearn

Machine learning and neural networks Другие технологии

Превью для статьи

15.05.2023, Артем Сиянов, г. Хабаровск

Роботы-эмпаты, миф или реальность?

Нужно быстро провести UX-исследование продукта? Предобученные модели-трансформеры помогут!

Machine learning and neural networks Другие технологии

Превью для статьи

21.04.2023, Дворников Дмитрий,г. Москва

Как научить Наивного Байеса давать персональные рекомендации

В публикации расскажу о подходе,
позволяющем расширить функциональные возможности метода Наивного Байеса благодаря использованию весовых коэффициентов для различных групп признаков объекта датасета. С помощью разработанной ML‑модели можно улучшить качество классификации текстов при использовании обучающей выборки небольшого объёма и сократить время обучения модели.

Machine learning and neural networks Другие технологии

Превью для статьи

06.04.2023, Котов Илья, г. Екатеринбург

Поиск ошибок в логике работы чат-бота с помощью TF-IDF и DBSCAN

На примере задачи поиска логических ошибок робота, я продемонстрирую, как методы тематического моделирования помогут исследователя при работе с большим объемом текстовых данных.

Text mining Технологии аудита

Превью для статьи

28.10.2022, Морозов Никита, г. Екатеринбург

Fine-Tune модели основанной на трансформерах (Rubert) для классификации текстов

В посте представлю state of the art подход для решения задачи бинарной классификации, а именно детекция сообщений, в которой присутствует жалоба на сотрудника.

Text mining Технологии аудита