Parser dla strony otomoto.pl

Javascript & Typescript 211 PLN
Praca 1 z 8
Skrypt zbiera dane (nazwa, cena, telefon) z ogłoszeń na stronie Otomoto.

Kluczowymi problemami były ochrona strony przed botami oraz dekodowanie telefonów bez użycia przeglądarek dla maksymalnej szybkości i zmniejszenia zużycia zasobów. Rozwiązanie polega na specjalnej symulacji zachowania prawdziwej przeglądarki. Przeprowadzono również odwrotną inżynierię (reverse engineering) algorytmu dekodowania numerów telefonów.

Możliwości:
* Wielowątkowa obsługa listy linków z pliku
* Obsługa proxy SOCKS5 i ich rotacja dla każdego zapytania
* Automatyczne ponowne próby przy nieudanych zapytaniach
* Elastyczne ustawienia przez parametry uruchomienia
* Zapisywanie wyników do pliku CSV oraz szczegółowy log błędów
* Możliwość pracy bez proxy i w jednym wątku

Użyte technologie
* Język programowania: Node.js
* Biblioteki: got-scraping, p-queue, fast-csv, socks-proxy-agent

#scraping #parsing #Node.js #otomoto #kontakty
Szczegóły
  • Dodana:
141

Freelancer

  • Zleceń 72
  • Ocena 5.0
  • Ranking 8 542
Zarejestruj się

Jeśli masz konto, zaloguj się

Wskaźniki

  • Ostatnia wizyta: 3 godziny 23 minuty temu
  • Odpowiada w ciągu doby