Parser sklepu internetowego Rozetka
Projekt: parser Rozetka
Zadanie: Zautomatyzować zbieranie aktualnych cen i dostępności sprzętu z witryny Rozetka w celu monitorowania rynku.
Trudność polegała na agresywnej ochronie witryny oraz skomplikowanej strukturze kodu HTML.
Rozwiązanie: Stworzyłem rozwiązanie w Pythonie, które emuluje sesję przeglądarki. Użyłem hybrydowego podejścia: Selenium do renderowania JavaScriptu oraz BeautifulSoup do szybkiego parsowania HTML. Zrealizowałem niezawodne selektory CSS, odporne na zmiany układu witryny, oraz obsługę błędów sieciowych.
Zadanie: Zautomatyzować zbieranie aktualnych cen i dostępności sprzętu z witryny Rozetka w celu monitorowania rynku.
Trudność polegała na agresywnej ochronie witryny oraz skomplikowanej strukturze kodu HTML.
Rozwiązanie: Stworzyłem rozwiązanie w Pythonie, które emuluje sesję przeglądarki. Użyłem hybrydowego podejścia: Selenium do renderowania JavaScriptu oraz BeautifulSoup do szybkiego parsowania HTML. Zrealizowałem niezawodne selektory CSS, odporne na zmiany układu witryny, oraz obsługę błędów sieciowych.