Превью для статьи

Microsoft Bing и ChatGPT – buddy DA/DS-аудитора

Кто такой buddy? Человек, который может подсказать решение, когда ты зашёл в тупик, подскажет, как лучше прокачать навыки, ответит, если тебе что-то непонятно. Личный buddy – мечта любого. Мы с моим коллегой DA/DS-аудиторы и решили протестировать новые инструменты: ChatGPT, чат поисковика Bing и выяснить, смогут ли они стать нашими buddy.

Превью для статьи

Максимально просто о распознавании речи при помощи NeMo

В лучших традициях «питоновского дзена» мы будем максимально красивы, явны, просты, в меру сложны, читаемы и даже попытаемся легко объяснить данную реализацию, что как всем известно является признаком хорошей идеи. Ах да, и это прямо сейчас, что не никогда, так сказать, все признаки хорошего материала уже на лицо, в путь.

Превью для статьи

Методы Pandas и Scikit-learn для подготовки данных

При подготовке структурированных данных использование языка программирования Python и в частности применение методов библиотек Pandas и Scikit-learn – это один из способов успешного решения такой задачи для Data Science специалиста.

Превью для статьи

Опыт извлечения обучающих данных из генеративных языковых моделей

В последнее время сложилась такая тенденция, что компания обзаводятся собственным чат-ботом. Наиболее функциональные чат-боты работают на основе генеративных текстовых моделей. Но не у всех получается удачное решение с первого раза. В этой статье разбираемся с языковыми моделями и пробуем извлечь из них обучающие данные, чтобы понять каким не должен быть итоговый продукт

Превью для статьи

PyCaret — ML в несколько строк кода

Сегодня постараемся разобраться в некоторых тонкостях данной библиотеки на примере встроенного в PyCaret датасета.

Превью для статьи

Простой граф знаний на текстовых данных

Сегодня на простом примере рассмотрим – как провести краткий обзор неструктурированных данных в виде графа знаний.

Превью для статьи

Поиск дубликатов изображений с использованием Computer Vision

Как найти дубликаты изображений среди нескольких тысяч файлов, если они представлены разных форматах? Делюсь опытом использования Computer Vision для поиска дубликатов изображений документов