Нечітке текстове зіставлення
Коли потрібно зіставити записи у двох таблицях за текстовими полями, які мають схожий зміст, але відрізняються написанням — від простих друкарських помилок і різних відмінків до перестановки слів, абревіатур або написання різними мовами — використання алгоритмів автоматичного співставлення дає гарні результати лише для друкарських помилок або слів із різними відмінками. Улюблений Fuzzy Lookup в Excel, заснований на старому доброму алгоритмі Левенштейна, здатний виконати лише половину роботи; другу половину записів не можна буде зіставити автоматично, оскільки деякі відповідності можуть визначити лише ті, хто знає історію заповнення даними та створення таблиць.
Тому я пропоную своїм клієнтам інструмент для напівавтоматичного зіставлення записів двох таблиць. Я створюю форму з двома списками (вгорі та внизу), у кожен з яких потрапляють набори схожих записів. Оператор обирає по одному запису з кожного списку, і саме ці два записи будуть зіставлені.
На обробку кожної відповідності та ухвалення рішення оператору знадобиться від 5 до 15 секунд. В результаті виходить табличка з 100% безпомилково зіставленими записами. Треба просто докласти зусиль та витратити час — і вуаля!
Тому я пропоную своїм клієнтам інструмент для напівавтоматичного зіставлення записів двох таблиць. Я створюю форму з двома списками (вгорі та внизу), у кожен з яких потрапляють набори схожих записів. Оператор обирає по одному запису з кожного списку, і саме ці два записи будуть зіставлені.
На обробку кожної відповідності та ухвалення рішення оператору знадобиться від 5 до 15 секунд. В результаті виходить табличка з 100% безпомилково зіставленими записами. Треба просто докласти зусиль та витратити час — і вуаля!