Codeium и StarCoder: нейросети с автодополнением кода

Советуем почитать

Генерация паспортных данных для обучения моделей

Я знаю, что ты делал этой ночью

LLM'ы в преобразовании запроса на естественном языке в SQL (text2sql)

Ускоряем обучение с подкреплением на 50%

Доверительный интервал коэффициента Джини. Что это?

Создание персонажей в Python с помощью LLM: from GPT to Kandinsky

Data News

16-17 апреля 2024 года

XVI Национальная конференция ИВА «Внутренний аудит в России

26-27 июля 2024 года

PyCon Russia - конференция для python-разработчиков

Превью для статьи

21.11.2023, Котов Илья, Коробова Марина, г. Екатеринбург

Codeium и StarCoder: нейросети с автодополнением кода

В мире технологий происходит настоящая революция. На передовом фронте этой революции стоят нейронные сети — мощные и удивительные инструменты искусственного интеллекта, которые сегодня изменяют наше представление о возможностях компьютеров. Сегодня мы познакомим вас с двумя моделями-помощниками с автодополнением кода: StarCoder и Codeium.

Machine learning and neural networks Технологии аудита

Превью для статьи

15.03.2023, Анна Ламеева, г. Москва

Быстрый старт в Apache Spark ML

В рамках публикации расскажу о первоначальной обработке данных датасета, а также об обучении модели градиентного бустинга. Покажу базовые трансформации и действия, необходимые для получения результата обучения модели, что послужит хорошим и быстрым стартом для понимания работы Spark ML

Databases and big data Другие технологии

Превью для статьи

18.07.2022, Кухтенко Андрей, г. Хабаровск

Spark способы оптимизации запросов

Основная проблема при работе с BigData – это не написание скрипта для получения результата, а максимальное сокращение времени его работы и объема затрачиваемых ресурсов. Для решения этих задач отлично подходит Apache Spark с его удивительно гибкими возможностями по оптимизации кода. Сегодня я опишу несколько способов оптимизации запросов.

Data manipulation Другие технологии

Превью для статьи

15.03.2022, Цыба Олег,г. Воронеж

ML на распределенных данных

При работе с большими данными часто используются алгоритмы ML. Так как большие данные хранятся в распределённых хранилищах, то для работы с ML, в классическом варианте, нужно сначала собрать все данные в одно место, а потом начать работу сними – это не всегда удобно. Но есть более интересный и удобный вариант – библиотека MLlib Apache Spark.

Machine learning and neural networks Другие технологии

Превью для статьи

22.06.2021, Кагерманов Рамазан, г. Москва

Конфигурирование SparkSession

Добрый день, друзья!
Сегодня мы продолжим рассматривать Spark, в частности расскажем о способах конфигурирования SparkSession.

Databases and big data Другие технологии

Превью для статьи

18.06.2021, Фадюшина Маргарита, г. Иркутск

Параметрическая оптимизация задач Spark

Скорость обработки больших данных средствами фреймворка Apache Spark во мно-гом обеспечивается грамотной настройкой его параметров. Об этом мы и поговорим в данной статье

Databases and big data Другие технологии

Превью для статьи

30.03.2021, Дарья Донская, г. Иркутск

Что такое Spark и с чем его едят?

Статья больше рассчитана для новичков, кто впервые сталкивается со Spark. Сейчас кол-во информации растет, и требуются ресурсы и время для ее обработки. В связи с этим на свет появляться модель MapReduce, которая параллельно вычисляет операции на кластерах.
MapReduce отлично упрощает анализ big data на больших, но ненадежных кластерах. Стоит отметить, что с ростом популярности фреймворка пользователи хотят большего.

Databases and big data Другие технологии