Web Scraper судових реєстрів США (Витяг даних із PDF) для B2B-пр
Завдання: Автоматизувати збір "гарячих" лідів (власників бізнесу, на яких подали до суду) для юридичних компаній США, витягуючи дані зі складних державних сайтів та сканованих документів.
Рішення: Написано автоматизований парсер, який обходить базові захисти сайту суду (NYSCEF), знаходить потрібні справи, завантажує PDF-документи (скарги) та за допомогою аналізу тексту витягує імена власників бізнесу та їхні адреси.
Результат: Автоматизовано генерацію Excel/CSV таблиць з готовими контактами для відділу продажів, що замінило тижні ручного пошуку.
Стек технологій: Python, Playwright (для обходу блокувань та навігації), PyMuPDF / pdfplumber (для читання PDF), Pandas (для експорту в таблицю).
Рішення: Написано автоматизований парсер, який обходить базові захисти сайту суду (NYSCEF), знаходить потрібні справи, завантажує PDF-документи (скарги) та за допомогою аналізу тексту витягує імена власників бізнесу та їхні адреси.
Результат: Автоматизовано генерацію Excel/CSV таблиць з готовими контактами для відділу продажів, що замінило тижні ручного пошуку.
Стек технологій: Python, Playwright (для обходу блокувань та навігації), PyMuPDF / pdfplumber (для читання PDF), Pandas (для експорту в таблицю).