Программирование Автоматизация
Картинка анонса

Поиск совпадений

Каждый из нас ежедневно сталкивается с задачей сопоставления большого объема данных. В этой статье я хочу поделиться практикой решения задачи, когда данные совпадают по косвенным признакам и имеют различную структуру. Например, поиск совпадений адресов из внешних источников с внутренними базами данных. Для этого я использовал язык программирования Python и алгоритм Расстояния Левенштейна.

Программирование Автоматизация
Картинка анонса

Поиск совпадений

Каждый из нас ежедневно сталкивается с задачей сопоставления большого объема данных. В этой статье я хочу поделиться практикой решения задачи, когда данные совпадают по косвенным признакам и имеют различную структуру. Например, поиск совпадений адресов из внешних источников с внутренними базами данных. Для этого я использовал язык программирования Python и алгоритм Расстояния Левенштейна.

Программирование Автоматизация
Картинка анонса

Расстояние Левенштейна для поиска опечаток в данных клиента

В процессе работы часто встречаются задачи сравнения, казалось бы, похожих данных. Например, клиенты с одинаковыми паспортными данными, но немного отличающимися ФИО. Как понять, где была допущена ошибка: в ФИО (то есть мы имеем одного и того же клиента) или в серии и номере паспорта?