Парсинг базы дизайнеров, архитекторов и прорабов — Киев
Задача: собрать максимально полную базу контактов практикующих дизайнеров интерьера, архитекторов и прорабов Киева из нескольких открытых источников.
Что было сделано:
Написала Python-скрипт с использованием автоматизации браузера (Selenium + Chrome). Программа собирала данные параллельно с нескольких площадок: каталог bazadizainerov.com, объявления на OLX.ua и Kabanchik.ua, карточки компаний из Google Maps.
Из каждого профиля извлекались: имя, телефон, email, Instagram, описание и прямая ссылка. После сбора проведена автоматическая дедупликация по номеру телефона. Финальный результат выгружен в Excel.
Результат:
- Обработано 4 источника.
- Просмотрено 2 600+ профилей.
- 1 400 уникальных контактов в финальной базе после дедупликации.
- 1 200 контактов с номером телефона.
- 870 контактов с emai
Технологии: Python, Selenium, ChromeDriver, openpyxl, regex.
#парсинг #python #selenium #веб_скрапинг #автоматизация #сбор_данных #скрапинг
Что было сделано:
Написала Python-скрипт с использованием автоматизации браузера (Selenium + Chrome). Программа собирала данные параллельно с нескольких площадок: каталог bazadizainerov.com, объявления на OLX.ua и Kabanchik.ua, карточки компаний из Google Maps.
Из каждого профиля извлекались: имя, телефон, email, Instagram, описание и прямая ссылка. После сбора проведена автоматическая дедупликация по номеру телефона. Финальный результат выгружен в Excel.
Результат:
- Обработано 4 источника.
- Просмотрено 2 600+ профилей.
- 1 400 уникальных контактов в финальной базе после дедупликации.
- 1 200 контактов с номером телефона.
- 870 контактов с emai
Технологии: Python, Selenium, ChromeDriver, openpyxl, regex.
#парсинг #python #selenium #веб_скрапинг #автоматизация #сбор_данных #скрапинг