Превью для статьи

Опыт участия в Data Science соревновании на платформе Kaggle в области компьютерного зрения (object detection)

Добрый день! Сегодня я хочу рассказать об участии в соревновании для студентов на платформе Kaggle в области компьютерного зрения – “NTA Payment systems detection challenge”.

Превью для статьи

Поиск совпадений

Каждый из нас ежедневно сталкивается с задачей сопоставления большого объема данных. В этой статье я хочу поделиться практикой решения задачи, когда данные совпадают по косвенным признакам и имеют различную структуру. Например, поиск совпадений адресов из внешних источников с внутренними базами данных. Для этого я использовал язык программирования Python и алгоритм Расстояния Левенштейна.

Превью для статьи

Расстояние Левенштейна для поиска опечаток в данных клиента

В процессе работы часто встречаются задачи сравнения, казалось бы, похожих данных. Например, клиенты с одинаковыми паспортными данными, но немного отличающимися ФИО. Как понять, где была допущена ошибка: в ФИО (то есть мы имеем одного и того же клиента) или в серии и номере паспорта?

Data News