Techniczne zadanie na opracowanie parsera (skrapera) Amazon
Zadanie: Należy opracować niezawodny i odporny na błędy skraper do pozyskiwania informacji z Amazon o dużej liczbie produktów (miliony ASIN). Skraper powinien stabilnie działać w trybie 24/7 i minimalizować występowanie błędów HTTP 503 (blokada lub ograniczenie dostępu).
Wymagania obowiązkowe:
Parsowanie danych:
- Pozyskiwanie informacji o produktach: nazwa, cena, ocena, liczba recenzji, dostępność w magazynie, opis produktu, zdjęcia i inne informacje ze strony produktu według podanej listy ASIN.
- Wsparcie dla dużej liczby zapytań (od 100 000 do kilku milionów produktów).
Stabilność i skalowalność:
- System powinien działać przez całą dobę (24/7), bez regularnych przerw i potrzeby ręcznego ponownego uruchamiania.
- Przewidzieć mechanizmy równoważenia zapytań, wykorzystanie serwerów proxy, zmiany adresów IP oraz mechanizmy opóźnienia zapytań w celu minimalizacji ryzyka blokad i błędów HTTP 503.
Obchodzenie zabezpieczeń i ograniczeń Amazon:
- Przewidzieć metody obchodzenia ochrony antybotowej Amazon (CAPTCHA, blokada po IP, ograniczenia po User-Agent itp.).
- Wykorzystanie mechanizmów automatycznego rozpoznawania i rozwiązywania CAPTCHA (na przykład za pomocą usług antycaptcha).
Zarządzanie proxy:
- System powinien integrować wykorzystanie serwerów proxy z możliwością automatycznej rotacji i monitorowania ich sprawności.
- Skonfigurować monitorowanie jakości proxy, wykluczenie zablokowanych i wolnych IP.
Zarządzanie błędami i logowanie:
- Wdrożyć logowanie wszystkich działań skrapera: udane zapytania, błędy, blokady i czas odpowiedzi.
- Wdrożyć system automatycznego powtarzania zapytań w przypadku błędów, z konfigurowalną liczbą powtórzeń i interwałem między nimi.
Format i przechowywanie danych:
- Możliwość eksportu danych w wygodnych formatach (CSV, JSON, bazy danych).
- Realizacja szybkiej i efektywnej struktury przechowywania pozyskanych danych.
Interfejs zarządzania (opcjonalnie):
- Możliwość wygodnego zarządzania zadaniami, przeglądania statystyk i stanu pracy skrapera przez interfejs webowy lub API.
Wymagania wobec wykonawcy:
- Doświadczenie w pracy z web scrapingiem z Amazon.
- Znajomość technologii i narzędzi do obchodzenia zabezpieczeń (proxy, antycaptcha).
- Doświadczenie w pracy z dużymi zbiorami danych i asynchronicznymi zapytaniami.
Oczekiwany rezultat: Działające, stabilne i skalowalne narzędzie, zdolne do całodobowego wykonywania zadań związanych z parsowaniem dużej ilości danych z Amazon, minimalizując prawdopodobieństwo blokad i błędów.
Aktualne zlecenia dla freelancerów w kategorii C i C++
Inżynier infrastruktury proxy mieszkalnychBudujemy sieć proxy dla użytkowników od podstaw — w pełni własną, bez dostawców zewnętrznych. Potrzebujemy jednego wyjątkowego inżyniera sieci, który zbuduje całą podstawę techniczną. Co zbudujesz: - SDK w tle dla Androida, które kieruje ruch proxy przez urządzenia użytkowników… C i C++, DevOps ∙ 3 dni 19 godzin temu ∙ 13 ofert |
Dobrobka w istniejącej wersji 1c detalicznego bloku dla RC (centrum dystrybucji)Ogólnie wyjaśnię, co mamy za bazę - jest ogólny serwer, gdzie znajduje się baza Detal (gdzie rejestrowane są wszystkie przychody) - baza UTP, do której przelewają się wszystkie sprzedaże - liczy się marża, stany magazynowe - małe bazy detalicznych sklepów. W przypadku wymian,… C i C++, C# ∙ 4 dni 10 godzin temu ∙ 6 ofert |
Mistrzowska program «KONSTRUCTOR»
15 253 PLN
Szukamy bardzo doświadczonego programisty C++ do modernizacji istniejącego oprogramowania (programu głównego). Program odpowiada za tworzenie pochodnego oprogramowania reprezentującego sesje audiowizualnej korekcji psychologicznej. Obecna wersja jest napisana w czystym WinAPI… C i C++, Aplikacje desktopowe ∙ 9 dni 13 godzin temu ∙ 19 ofert |
Pisanie kodu dla ArduinoPotrzebne jest opracowanie oprogramowania dla wagowego dozownika opartego na Arduino Uno. Komponenty: Arduino Uno R3 HX711 + czujnik tensometryczny Wyświetlacz LCD1602 I2C Matryca LED MAX7219 8x32 5 przycisków sterujących 4-kanałowe przekaźniki 2 lampy sygnalizacyjne Wibromagnes… C i C++, Systemy wbudowane i mikrokontrolery ∙ 10 dni 22 godziny temu ∙ 15 ofert |
Trzeba dokończyć projekt lub udzielić konsultacji.
82 PLN
|