Parser zamówienia
Szukam programisty Python do stworzenia stabilnego parsera ofert pracy z serwisu Bundesagentur für Arbeit (https://www.arbeitsagentur.de/jobsuche/.
Ostateczne narzędzie ma zbierać oferty pracy z listy oraz stron szczegółowych ofert, stosować obowiązkowe filtry i zwracać ustrukturyzowaną tabelę według moich kolumn.
W projekcie przewidziano prosty dashboard (interfejs webowy), abym mógł samodzielnie uruchamiać zbieranie (słowo kluczowe, miasto/zakres, okres publikacji), nacisnąć „Start” i otrzymać gotowy plik Excel/CSV/Google Sheet.
Ważne: na BA jest captcha (hCaptcha).
Materiały, które dołączę do projektu
Job Page.png — pokazuje, gdzie dokładnie brać: Pozycja, Unternehmen, Straße und Hausnummer, PLZ/Ort, Ansprechperson (AP), Telefon, E-Mail, Homepage, Veröffentlichungsdatum, Referenz-Nr. (nr.), Einsatzort, Link na ogłoszenie.
Filters BA.png — pokazuje, jakie filtry obowiązkowo włączyć przed parsowaniem:
Zeitarbeit ausschließen (wykluczyć)
Externe Stellenbörsen ausschließen (wykluczyć)
Veröffentlichungsdatum (okres: 24h / 7 dni / 14 dni / 1 miesiąc)
Mailing Datenbank.xlsx — wzór kolumn, które należy wypełnić (można brać nazwy kolumn bezpośrednio z tego pliku).
Kolumny tabeli wyjściowej (dokładnie jak w pliku)
– Datum Scraping
– Veröffentlichungsdatum
– nr. (Referenz-Nr.)
– Pozycja
– Unternehmen
– Straße und Hausnummer
– PLZ, Ort
– Telefon
– Internet (Homepage)
– Ansprechperson (AP)
– E-Mail – AP Firma
– Einsatzort
– Link na ogłoszenie
– wszystkie oferty
Jeśli pole jest nieobecne na stronie — wstawiać empty.
Filtry (obowiązkowe)
Zeitarbeit = false (żadnej Zeitarbeit w wynikach)
Externe Stellenbörsen = ausblenden (odciąć zewnętrzne giełdy)
Veröffentlichungsdatum = ostatnie X dni (według parametru w dashboardzie, 24h / 7 dni / 14 dni / 1 miesiąc)
Deduplication
Klucz główny: Referenz-Nr. (nr.)
Wymagania dotyczące jakości danych
Adres podzielony: Ulica / PLZ / Ort
Telefon/E-mail — czyste wartości (bez „E+11”, bez zbędnych symboli)
Job URL — klikalny URL karty oferty pracy (nie wewnętrzny ID)
Veröffentlichungsdatum: jeśli „vor X Tagen” — konwertować na dokładną datę
Wymagania techniczne
Ponowne uruchomienie nie tworzy duplikatów.
Dashboard (minimalny)
Pola: słowo kluczowe, miasto/zakres, okres publikacji (24h/7/14/30), checkboxy filtry Zeitarbeit/Externe
Przycisk Start → po wykonaniu daje pobierz Excel oraz — push do Google Sheet).
Kryteria akceptacji
Wynik Excel/CSV dokładnie według struktury „Mailing Datenbank.xlsx” (nazwy kolumn z pliku).
Losowa kontrola 50 ofert: adresy podzielone, kontakty czyste, Veröffentlichungsdatum — dokładne daty, URL otwierają się.
Jeśli danych brak — w odpowiedniej kolumnie stoi
empty.README z instrukcją oraz krótkim raportem (ile zebrano, odfiltrowano Zeitarbeit/Externe, liczba duplikatów, liczba 429/5xx, jak przetwarzano captcha).
Etapowość i test
Zadanie testowe (obowiązkowe): zebrać 20 ofert pracy „Lagermitarbeiter/in” w ciągu 7 dni, stosując filtry; oddać Excel/CSV według struktury pliku; brakujące pola oznaczyć
empty.Etap 1 (kontrakt): pełny parser BA + deduplikacja + zasada
empty+ wynik w Excel/CSV.
Opinia zleceniodawcy o współpracy z Sergey Andreyev
Parser zamówieniaDobra komunikacja, szybko, jakościowo - polecam
Opinia freelancera o współpracy z Oleksandra Kilimnik
Parser zamówieniaPodobała się współpraca, zrozumienie i rozwiązywanie problemów.
-
2283 25 1 Witam, rozwijam w pythonie od ponad 5 lat, dosłownie niedawno zakończyłem projekt z parsowaniem Linkedina, gdzie również jest captcha. Zapoznałem się z witryną, jest opcja z użyciem zapytań dla szybkości, a jest z użyciem przeglądarki antydetekcyjnej dla niezawodności, tworzenie w excelu nie stanowi problemu, można użyć biblioteki pandas. Proponuję również interfejs na flasku, przy uruchamianiu programu będzie lokalny interfejs webowy, z przyciskami, ładnym wyglądem i logowaniem do przeglądania procesu pracy. Będę zadowolony, aby omówić szczegóły i przejść do współpracy!
-
765 7 0 Jestem programistą Pythona z ponad 7-letnim doświadczeniem. Wygląda na to, że jest zrozumiałe. Jestem gotowy, aby się tym zająć!
-
991 12 1 Jestem gotowy szybko i jakościowo zrealizować Twoje zamówienie. Mam doświadczenie w pracy z podobnymi projektami, zawsze przestrzegam terminów i wymagań technicznych. Będę zadowolony ze współpracy!
-
8193 63 1 Dzień dobry,
Jestem gotów podjąć się projektu opracowania stabilnego parsera ofert pracy z strony Bundesagentur für Arbeit. Moim zadaniem będzie stworzenie narzędzia, które automatycznie zbierać będzie oferty pracy, stosować obowiązkowe filtry i zwracać uporządkowaną tabelę zgodnie z Twoimi kolumnami. Dołączę również prosty dashboard do wygodnego uruchamiania zbierania danych i uzyskiwania wyników w formacie Excel/CSV/Google Sheet.
Biorąc pod uwagę obecność CAPTCHA na BA, wdrożę odpowiednie przetwarzanie.
Z niecierpliwością czekam na możliwość spróbowania swoich sił, moje wymagania to 16$ za godzinę. Na początek konieczne jest dokładniejsze zapoznanie się ze wszystkimi materiałami i zadaniem.
Artur
-
172 1 1 Dzień dobry! Jestem gotów wykonać ten projekt. Mam duże doświadczenie w tworzeniu różnych aplikacji.
-
10123 117 0 Witam.
Opracowuję parsery w NodeJS. Jestem gotów się tym zająć. Piszcie, omówimy.
-
1512 15 0 1 Dzień dobry. Spojrzałem. Już mam plan realizacji - proszę się zgłaszać.
Aktualne zlecenia dla freelancerów w kategorii Bazy danych i SQL
Rozwiązać problem z obciążeniem hostingu strony na PrestaShopStrona z każdym miesiącem potrzebuje coraz więcej zasobów. Odpowiedź hostingu: Podczas sprawdzania serwera odnotowano zwiększone obciążenie ze strony serwera baz danych MySQL. W momentach wystąpienia błędu 500 proces MySQL wykorzystuje znaczną część zasobów procesora, co może… PHP, Bazy danych i SQL ∙ 1 godzina 21 minut temu ∙ 10 ofert |
Konfiguracja systemu kopii zapasowej i optymalizacja infrastruktury serwerowejCel prac: Zapewnienie niezawodnego przechowywania danych systemu CRM i aplikacji poprzez wdrożenie zautomatyzowanego systemu tworzenia kopii zapasowych (Backups), a także przeprowadzenie szeregu poprawek serwerowych w celu zwiększenia stabilności, bezpieczeństwa i wydajności… DevOps, Bazy danych i SQL ∙ 2 godziny 51 minut temu ∙ 12 ofert |
System PIM
820 PLN
Trzeba zrobić system PIM. Liczba produktów — kilka milionów. Jest kilku dostawców, którzy podają dane w różnych formatach: csv, xml, API. Dane są ograniczone, często trzeba znajdować cechy produktów w innych źródłach i uzupełniać. Trzeba zrobić tabelę, w której będą… Bazy danych i SQL, Programowanie stron internetowych ∙ 4 godziny 49 minut temu ∙ 31 ofert |
Integracja BAS szwejk 8
820 PLN
Dzień dobry, trzeba zintegrować BAS szwejk 8, podłączyć stronę i CRM sales drive, ustawić raporty i inne dane Bazy danych i SQL ∙ 5 godzin 54 minuty temu ∙ 7 ofert |
Stworzyć dashboard w https://airtable.com/ dotyczący efektywności reklamowych kreacji z facebook adsPełnoprawne TZ https://docs.google.com/document/d/1_n_oYRNZWYxalUA---DM5AD1b5ZSrtePw5J4G42svGw/edit?usp=sharing Bazy danych i SQL, Parsowanie danych ∙ 1 dzień temu ∙ 16 ofert |