Веб-скрейпер судебных реестров США (Извлечение данных из PDF) для B2B-пр
Задача: Автоматизировать сбор "горячих" лидов (владельцев бизнеса, на которых подали в суд) для юридических компаний США, извлекая данные со сложных государственных сайтов и сканированных документов.
Решение: Написан автоматизированный парсер, который обходит базовые защиты сайта суда (NYSCEF), находит нужные дела, загружает PDF-документы (жалобы) и с помощью анализа текста извлекает имена владельцев бизнеса и их адреса.
Результат: Автоматизирована генерация Excel/CSV таблиц с готовыми контактами для отдела продаж, что заменило недели ручного поиска.
Стек технологий: Python, Playwright (для обхода блокировок и навигации), PyMuPDF / pdfplumber (для чтения PDF), Pandas (для экспорта в таблицу).
Решение: Написан автоматизированный парсер, который обходит базовые защиты сайта суда (NYSCEF), находит нужные дела, загружает PDF-документы (жалобы) и с помощью анализа текста извлекает имена владельцев бизнеса и их адреса.
Результат: Автоматизирована генерация Excel/CSV таблиц с готовыми контактами для отдела продаж, что заменило недели ручного поиска.
Стек технологий: Python, Playwright (для обхода блокировок и навигации), PyMuPDF / pdfplumber (для чтения PDF), Pandas (для экспорта в таблицу).