Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak

Skraper do generowania leadów B2B (Bazy danych korporacyjnych)

Cel: Opracowanie zautomatyzowanego web scrapera w Pythonie do zbierania uporządkowanych danych kontaktowych i finansowych potencjalnych klientów B2B z publicznych katalogów biznesowych.

Moje rozwiązanie i realizacja techniczna:

Parsowanie tabel HTML: Skrypt skutecznie przeszukuje strony katalogów i wyciąga potrzebne informacje ze skomplikowanej struktury tabelarycznej stron za pomocą biblioteki BeautifulSoup.

Stabilność działania: Aby zapobiec blokadom ze strony docelowych serwerów, skonfigurowano niestandardowe nagłówki HTTP, które imitują zapytania z prawdziwej przeglądarki. Zapewniło to nieprzerwane zbieranie danych podczas długich sesji.

Głębokie czyszczenie danych: Zebrane "surowe" informacje często zawierały zbędne znaki i artefakty formatowania. Za pomocą biblioteki Pandas wdrożyłem logikę automatycznego czyszczenia kluczowych metryk. Na przykład pola "Przychód firmy" oraz "Liczba pracowników" zostały programowo oczyszczone z tekstu i przekształcone w ścisłe wartości liczbowe.

Przygotowanie do CRM: Ostateczny zestaw danych jest automatycznie eksportowany w poprawnym formacie CSV z właściwą strukturą kolumn.

Wykorzystane technologie:
Python, BeautifulSoup, Pandas, Konfiguracja nagłówków HTTP.

Wynik:
Zleceniodawca otrzymał w pełni zautomatyzowane narzędzie do generowania leadów. Na wyjściu powstaje idealnie czysty plik CSV, który można natychmiast zaimportować do dowolnego systemu CRM bez potrzeby dodatkowego ręcznego przetwarzania czy poprawiania błędów formatowania.
Szczegóły pracy
Dodana 12 marca
123 wyświetlenia
Freelancer
Viktor Gayoha
Ukraina Czerniowce  2  0

Gotowy do podjęcia pracy Gotowy do podjęcia pracy
Zakończone 2 Sejfy
W serwisie 2 lata