Python/Selenium parser danych z avto.pro – praca z portfolio freelancera Романа | przykład z kategorii Parsowanie danych (№1854770)

Switch to English version?

Yes

Переключитись на українську версію?

Так

Переключиться на русскую версию?

Да

Przełączyć się na polską wersję?

Tak

Zaloguj się
Rejestracja
- Witamy na Freelancehunt
  
  Pracuj bez ryzyka, oszczędzaj czas i pieniądze
  
  Zaloguj się Rejestracja

Zadanie polegało na wyciągnięciu z witryny avto.pro danych sprzedawców, ich sklepów i warsztatów samochodowych.

Ponieważ większość potrzebnej treści ładowana jest na stronach dynamicznie, wykonałem to za pomocą #selenium. Główną trudnością w tym projekcie było znalezienie URL stron sprzedawców, ponieważ nie ma określonej listy ani strony, na której można je znaleźć.

Witryna została zaprojektowana w taki sposób (możliwe, że celowo), że aby przejść do strony sprzedawcy, trzeba przejść ścieżkę od wyboru samochodu lub części do wybrania konkretnej części. I dopiero wtedy, klikając na nią, widzimy tylko jej sprzedawcę.

Dlatego mój parser kliknie wszystkie części na wszystkich stronach (a jest ich ponad milion) i wyciągnie potrzebne informacje.

Wynik parsowania jest przechowywany w bazie danych #sqlite i eksportowany do pliku #Exell #xlsx

←
Praca 3 z 4
→

Dodana 30 lipca 2024

189 wyświetleń

Opublikuj analogiczne zlecenie

Roman P.

Lwów 6

Gotowy do podjęcia pracy

Zakończono 6 Sejfów

W serwisie 11 lat

←
Praca 3 z 4
→