Ceneo.pl parser
To aplikacja do zbierania danych o produktach z witryny Ceneo.pl.
Możliwości:
- Automatyczne zbieranie danych: Zbiera informacje o produktach (nazwa, ID, cena, dostępność) ze wszystkich stron kategorii.
- Obsługa paginacji: Automatycznie przechodzi na następne strony kategorii.
- Ekstrakcja danych z JSON-LD: Znajduje i wyodrębnia dane o produktach z oznaczenia JSON-LD na stronie.
- Zapis do Excela: Zapisuje zebrane dane do pliku Excel z oddzielnymi arkuszami dla każdej kategorii.
- Wygodny interfejs: Umożliwia łatwy wybór pliku z linkami do kategorii oraz pliku do zapisywania wyników.
- Logowanie: Wyświetla postęp wykonywania parsowania w oknie aplikacji.
Łatwe w użyciu:
- Wybierz plik z linkami do kategorii Ceneo.pl.
- Wybierz plik Excel do zapisywania danych.
- Naciśnij "Rozpocznij parsowanie".
Technologie:
- PyQt5: do tworzenia interfejsu graficznego.
- Playwright: do automatyzacji przeglądarki i interakcji z stronami internetowymi.
- Pandas: do przetwarzania i zapisywania danych w Excelu.
- JSON: do pracy z danymi JSON-LD.
Możliwości:
- Automatyczne zbieranie danych: Zbiera informacje o produktach (nazwa, ID, cena, dostępność) ze wszystkich stron kategorii.
- Obsługa paginacji: Automatycznie przechodzi na następne strony kategorii.
- Ekstrakcja danych z JSON-LD: Znajduje i wyodrębnia dane o produktach z oznaczenia JSON-LD na stronie.
- Zapis do Excela: Zapisuje zebrane dane do pliku Excel z oddzielnymi arkuszami dla każdej kategorii.
- Wygodny interfejs: Umożliwia łatwy wybór pliku z linkami do kategorii oraz pliku do zapisywania wyników.
- Logowanie: Wyświetla postęp wykonywania parsowania w oknie aplikacji.
Łatwe w użyciu:
- Wybierz plik z linkami do kategorii Ceneo.pl.
- Wybierz plik Excel do zapisywania danych.
- Naciśnij "Rozpocznij parsowanie".
Technologie:
- PyQt5: do tworzenia interfejsu graficznego.
- Playwright: do automatyzacji przeglądarki i interakcji z stronami internetowymi.
- Pandas: do przetwarzania i zapisywania danych w Excelu.
- JSON: do pracy z danymi JSON-LD.