Parsowanie danych z witryny internetowej i integracja z systemem publikacji danych
Konieczne jest opracowanie rozwiązania programowego do parsowania danych z określonej strony internetowej, która ma skomplikowaną strukturę. Uzyskane dane muszą być przetworzone i umieszczone w tabeli określonego formatu, nadającego się do dalszej publikacji na innej stronie internetowej lub platformie.
**Cel:**
Stworzenie narzędzia do automatycznego wydobywania danych z wskazanej strony internetowej i przekształcania ich w zorganizowaną tabelę, która może być łatwo zintegrowana z systemem publikacji danych.
**Główne zadania:**
1. **Analiza strony internetowej:**
- Przeprowadzenie analizy docelowej strony internetowej, zidentyfikowanie struktury HTML, JavaScript, AJAX i innych elementów, które mogą być używane do ochrony danych.
- Określenie możliwych ograniczeń i obejść dla skutecznego parsowania, z wyjątkiem metod omijania CAPTCHA.
2. **Opracowanie parsera:**
- Stworzenie parsera, który będzie w stanie wydobywać potrzebne dane ze strony według określonych parametrów.
- Zapewnienie możliwości dynamicznej zmiany parametrów parsowania (np. zmiana URL, zapytań użytkowników itp.).
- Zrealizowanie wsparcia dla pracy przez proxy w celu ominięcia ograniczeń dotyczących adresów IP.
- Zrealizowanie logowania i monitorowania procesów parsowania w celu śledzenia błędów i udanych zapytań.
3. **Przetwarzanie danych:**
- Opracowanie systemu do przekształcania surowych danych w zorganizowaną tabelę (CSV, Excel, bazy danych itp.).
- Zapewnienie weryfikacji i filtrowania danych w celu usunięcia duplikatów, niepoprawnych lub zbędnych informacji.
4. **Integracja z systemem publikacji:**
- Stworzenie interfejsu lub API do przesyłania danych do systemu publikacji na innej stronie.
- Zapewnienie automatycznej aktualizacji danych w przypadku zmian na docelowej stronie.
5. **Testowanie i debugowanie:**
- Przeprowadzenie testów parsera na różnych przykładach w celu sprawdzenia poprawności działania.
- Optymalizacja szybkości działania i odporności na możliwe zmiany na docelowej stronie.
**Wymagania dla kandydata:**
- Doświadczenie w opracowywaniu parserów dla stron internetowych o skomplikowanej strukturze.
- Znajomość narzędzi i metod użycia proxy do omijania ograniczeń.
- Doświadczenie w pracy z systemami przechowywania danych (SQL, NoSQL) i formatami danych (JSON, CSV, XML).
- Zrozumienie zasad pracy z API i integracji danych w zewnętrznych systemach.
- Umiejętność dokumentowania kodu i procesów dla dalszego wsparcia projektu.
**Dodatkowe życzenia:**
- Doświadczenie w pracy z dynamicznymi stronami internetowymi (używającymi AJAX, JavaScript).
- Znajomość Pythona, BeautifulSoup, Selenium, Scrapy lub podobnych narzędzi.
- Zrozumienie SEO i zasad rankingowania stron internetowych (pożądane).
**Oczekiwane wyniki:**
- W pełni funkcjonalny parser z możliwością zmiany ustawień.
- Dokumentacja dotycząca użycia i konfiguracji parsera.
- Testy potwierdzające poprawność działania parsera i zgodność wyników.
-
Добрый день, это не 50 евро стоит)
-
Было б неплохо увидеть сайт
-
Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych
Parsowanie produktów, przygotowanie do importu na WPWydobyć pełny katalog tych stron: https://svit-mebliv.ua/ https://kompanit.com.ua/ru https://amia.com.ua/ https://mebliromax.com.ua/ https://pehotin.com.ua/catalog/ https://www.sokme.ua/ru/ Wszystkie produkty muszą być połączone w jedną wspólną tabelę do importu do WP. Każdy… Programowanie stron internetowych, Parsowanie danych ∙ 1 dzień 20 godzin temu ∙ 54 oferty |
Szukam programisty do OpenCartDzień dobry 1) należy wdrożyć na stronie dneprkomfort.dp.uazakupiono moduł dla ukraińskich banków, już wdrożono Monto bank oto przykład naszego konkurenta Trzeba zrobić rozłożenie na raty, zakupy na raty (Monto Bank) Pumb, Sens, Monto domyślnie 2 płatności na 2 miesiące Pumb… Programowanie stron internetowych, Parsowanie danych ∙ 2 dni 17 godzin temu ∙ 48 ofert |
Wymagany specjalista ds. promocji w Telegramie.
107 PLN
Zadania: zapraszanie rzeczywistych użytkowników z bazy nazw użytkowników do nowych czatów oraz wysyłanie wiadomości do docelowej bazy. Interesuje nas tylko jakościowy ruch i praca z żywą publicznością — wykonawców korzystających z botów, sztucznego zwiększania lub niskiej… Parsowanie danych, Promocja w sieciach społecznościowych (SMM) ∙ 6 dni 19 godzin temu ∙ 9 ofert |
Konsultacja dotycząca parsowania subskrybentów kont InstagramWitam. Konieczne jest przeprowadzenie wstępnej oceny możliwości realizacji następującego zadania. Posiadam listę kont na Instagramie. Celem jest uzyskanie danych kontaktowych (w pierwszej kolejności adresów e-mail) użytkowników, którzy obserwują te konta. Wcześniej spotkałem… Parsowanie danych ∙ 10 dni 14 godzin temu ∙ 13 ofert |
Potrzebny specjalista do wyszukiwania kontaktów decydentów w UkrainieKonieczne jest zebranie bazy (lub gotowej bazy) kontaktów osób podejmujących decyzje (LPR) w firmach Ukrainy. Wyszukiwanie i zbieranie informacji, Parsowanie danych ∙ 10 dni 19 godzin temu ∙ 22 oferty |