Parsowanie bazy projektantów, architektów i kierowników budowy — Kijów
Zadanie: zebrać jak najbardziej kompletną bazę kontaktów praktykujących projektantów wnętrz, architektów i kierowników budowy w Kijowie z kilku otwartych źródeł.
Co zostało zrobione:
Napisałam skrypt w Pythonie z użyciem automatyzacji przeglądarki (Selenium + Chrome). Program zbierał dane równolegle z kilku platform: katalog bazadizainerow.com, ogłoszenia na OLX.ua i Kabanchik.ua, karty firm z Google Maps.
Z każdego profilu wyciągano: imię, telefon, email, Instagram, opis i bezpośredni link. Po zebraniu danych przeprowadzono automatyczną deduplikację według numeru telefonu. Ostateczny wynik został wyeksportowany do Excela.
Wynik:
- Przetworzono 4 źródła.
- Przejrzano 2 600+ profili.
- 1 400 unikalnych kontaktów w ostatecznej bazie po deduplikacji.
- 1 200 kontaktów z numerem telefonu.
- 870 kontaktów z emailem.
Technologie: Python, Selenium, ChromeDriver, openpyxl, regex.
#parsowanie #python #selenium #web_scraping #automatyzacja #zbieranie_danych #scraping
Co zostało zrobione:
Napisałam skrypt w Pythonie z użyciem automatyzacji przeglądarki (Selenium + Chrome). Program zbierał dane równolegle z kilku platform: katalog bazadizainerow.com, ogłoszenia na OLX.ua i Kabanchik.ua, karty firm z Google Maps.
Z każdego profilu wyciągano: imię, telefon, email, Instagram, opis i bezpośredni link. Po zebraniu danych przeprowadzono automatyczną deduplikację według numeru telefonu. Ostateczny wynik został wyeksportowany do Excela.
Wynik:
- Przetworzono 4 źródła.
- Przejrzano 2 600+ profili.
- 1 400 unikalnych kontaktów w ostatecznej bazie po deduplikacji.
- 1 200 kontaktów z numerem telefonu.
- 870 kontaktów z emailem.
Technologie: Python, Selenium, ChromeDriver, openpyxl, regex.
#parsowanie #python #selenium #web_scraping #automatyzacja #zbieranie_danych #scraping