Arser kalendarz, szkoleń i kursów zawodowych z kilku stron dostawców
Cel projektu Stworzenie skryptów w Pythonie, które automatycznie zbierają aktualne informacje o szkoleniach / kursach z witryn wiodących dostawców szkoleń zawodowych i zapisują dane w zorganizowanej tabeli (Excel / Google Sheets / CSV) do dalszej analizy, porównania i aktualizacji.
Lista witryn do parsowania (wszystkie obowiązkowe):
- Oxford Management Centre — https://oxford-management.com/training-course-calendar
- GLOMACS — https://glomacs.com/training-course-calendar
- LEORON Professional Development Institute — https://leoron.com (kalendarz często w PDF, na przykład https://www.leoron.com/download-document/leoron-training-calendar-2026.pdf i podobne)
- Boost Organization — https://boostorg.com/training-courses
- Informa Connect Academy — https://informaconnect.com/academy/courses + regionalne kalendarze (MEA, Londyn, APAC itd.)
I jeszcze kilka witryn, które zostaną przesłane wybranemu wykonawcy w wiadomości prywatnej
Zakres i częstotliwość Orientacyjnie 800–3000 rekordów (każde uruchomienie kursu w określonej lokalizacji/datach — osobny wiersz). Skrypt powinien wspierać regularne uruchamianie (co tydzień / co miesiąc) w celu aktualizacji danych bez duplikowania starych rekordów.
Struktura tabeli wyjściowej (obowiązkowe kolumny, angielskie nazwy w pliku):
| № | Nazwa kolumny (EN) | Opis / skąd brać | Uwagi / przykład |
|---|---|---|---|
| 1 | Dostawca | Nazwa dostawcy | GLOMACS / Oxford Management Centre |
| 2 | Kod kursu | Kod kursu (jeśli jest) | PMCMAR-2074 lub — |
| 3 | Tytuł kursu | Pełna nazwa kursu | Leading and Managing Yourself Training Course |
| 4 | Data rozpoczęcia | Data rozpoczęcia | 02 lut 2026 |
| 5 | Data zakończenia | Data zakończenia | 06 lut 2026 |
| 6 | Czas trwania dni | Liczba dni | 5 |
| 7 | Lokalizacja / Miejsce | Miasto, kraj, format (Klasa / Online / Wirtualny / Hybrydowy) | Dubaj, ZEA / Online |
| 8 | Opłata USD | Koszt (w dolarach, bez symbolu $ i przecinków) | 5950 |
| 9 | Przegląd kursu | Krótki opis (200–600 znaków) | This course helps leaders... |
| 10 | Cele | Główne cele (tekst lub lista przez średnik) | Learn to...; Develop... |
| 11 | Docelowa grupa odbiorców | Docelowa grupa odbiorców | Menadżerowie, profesjonaliści HR |
| 12 | Agenda Dzień 1 | Program Dnia 1 (pełny tekst) | Introduction to Self-Leadership... |
| 13 | Agenda Dzień 2 | Dzień 2 | ... |
| … | Agenda Dzień N | Do 10 dni (jeśli kurs jest dłuższy — połączyć w jedną kolumnę Pełna Agenda lub dodać kolumny) | … |
| 14 | URL szczegółowy | Bezpośredni link do strony kursu | https://glomacs.com/... |
| 15 | Certyfikat | Wydawany certyfikat | Certyfikat GLOMACS |
| 16 | Język | Język prowadzenia | Angielski |
| 17 | Ostatnie parsowanie | Data parsowania tego rekordu | 2026-01-28 |
Wymagania dotyczące realizacji
- Język: Python 3.10+
- Główne biblioteki: requests / httpx, BeautifulSoup4, Selenium (jeśli potrzebna dynamika / JS), pdfplumber / PyMuPDF (dla PDF LEORON), pandas (do przetwarzania i zapisywania)
- Obsługa błędów: pomijanie uszkodzonych stron, logowanie błędów (do pliku log.txt lub konsoli)
- Anty-blokada: rotacja User-Agent, losowe opóźnienia 3–12 sek, proxy (do omówienia osobno)
- Unikalność: przy aktualizacji nie duplikować rekordów (po kluczu Dostawca + Tytuł kursu + Data rozpoczęcia + Data zakończenia + Lokalizacja)
- Nie duplikować tych samych szkoleń u różnych dostawców
- Pliki wyjściowe:
- courses_full.xlsx (pełna tabela)
- courses_new.xlsx (tylko nowe/aktualizowane przy ostatnim uruchomieniu)
- log.txt
- Opcjonalnie (dodatkowa płatność):
- Automatyczne ładowanie do Google Sheets (gspread)
- Co tygodniowe uruchamianie przez cron / GitHub Actions
- Eksport do raportu PDF (WeasyPrint lub podobne) z ładną tabelą
Etapy pracy i akceptacja
- Prototyp: parsowanie 1 witryny (na przykład GLOMACS) + 10–20 wierszy w tabeli — demonstracja wyniku
- Pełny parser wszystkich 7 witryn + przetwarzanie agendy według dni
- Testowanie na aktualnych danych + czyszczenie duplikatów
- Ostateczne przekazanie: kod źródłowy (prywatne repozytorium GitHub lub archiwum), instrukcja uruchomienia, przykłady plików
Terminy Orientacyjnie 7–18 dni kalendarzowych (zależy od doświadczenia wykonawcy i trudności ochrony anty-botowej na witrynach). Stała płatność po demonstracji działającego prototypu + ostateczne rozliczenie po pełnym przekazaniu.
Dodatkowe życzenia
- Kod powinien być czytelny, z komentarzami
- Nie używać płatnych API / usług bez uzgodnienia
- Przestrzegać robots.txt i nie przeciążać witryn (ograniczenie szybkości)
- Jeśli witryna wymaga rejestracji, uprzedzić z wyprzedzeniem
Jeśli wykonawca ma pytania lub propozycje dotyczące poprawy struktury tabeli / automatyzacji — jestem gotów do dyskusji.
Czekam na wasze propozycje z portfolio dotyczącym parsowania (najlepiej przykłady podobnych zadań — zbieranie kalendarzy, kursów, wydarzeń, szkoleń).
-
4 dni409 PLN
277 1 1 4 dni409 PLNWitam! Mogę zrealizować ten projekt w ciągu kilku dni! Jakościowo i szybko, więcej szczegółów możemy omówić w prywatnych wiadomościach!
-
1 dzień368 PLN
172 1 1 1 dzień368 PLNWitaj! Jestem gotów zrealizować ten projekt, mam duże doświadczenie w tworzeniu różnych aplikacji.
-
1 dzień372 PLN
4120 8 0 1 1 dzień372 PLNDzień dobry.
Nasz zespół ma wieloletnie doświadczenie w tworzeniu systemów ERP, CRM, CMS oraz specjalistycznego oprogramowania dla biznesu. Tworzymy efektywne rozwiązania cyfrowe, które pomagają automatyzować procesy, zwiększać wydajność i skalować firmy.
Pracujemy z nowoczesnymi technologiami — od botów i skryptów po agentów AI i systemy analityczne. Opracowujemy strony internetowe o różnym stopniu skomplikowania. W naszym portfolio znajdują się zrealizowane rozwiązania ERP dla branży hotelarskiej, a także dla firm zajmujących się importem i sprzedażą towarów, a także nasz własny produkt XFitness — system ERP stworzony specjalnie dla klubów fitness.
Jesteśmy gotowi zrealizować Twój projekt i zaproponować najlepsze rozwiązanie dostosowane do Twoich potrzeb.
Nasze portfolio:Freelancehunt
Specjalizujemy się w następujących dziedzinach:
… - Rozwój systemów ERP
- Rozwój systemów CRM
- Rozwój stron internetowych o dowolnym stopniu skomplikowania
- Rozwój systemów CMS
- Wsparcie stron internetowych
- Rozwój OpenCart
- Wsparcie OpenCart
- Modyfikacja OpenCart
- Dopracowanie OpenCart
- Rozwój WordPress
- Wsparcie WordPress
- Modyfikacja WordPress
- Dopracowanie WordPress
- Rozwój ECommerce
- Wsparcie ECommerce
- Modyfikacja ECommerce
- Dopracowanie ECommerce
- Rozwój aplikacji internetowych
- Wsparcie serwerów 1C
- Wsparcie serwerów WWW
- Rozwój aplikacji mobilnych
- Parsowanie danych
- Rozwój botów
- Rozwój agentów AI
oraz w następujących technologiach:
- Python
- PHP
- Laravel
- Symfony
- Yii2
- JS
- NodeJS
- jQuery
- TypeScript
- MySQL
- HTML
- CSS
- Vue
- Nuxt.js
- React
- React Native
- C++
-
5 dni372 PLN
182 5 dni372 PLNOto zwięzła i jasna wersja, która pokazuje, że cenisz czas klienta:
Witam!
Zapoznałem się z TZ, zadanie jest całkowicie zrozumiałe. Mam odpowiednie doświadczenie w programowaniu w Pythonie (Selenium, BS4, Pandas).
Co do samego zadania:
PDF (LEORON): Zrealizuję przez pdfplumber lub PyMuPDF.
Dane: Zapewnię prawidłową strukturę (Agenda po dniach) oraz deduplikację zapisów.
Ochrona: Skonfiguruję rotację User-Agent oraz opóźnienia.
Jestem gotowy zacząć od prototypu (GLOMACS) w celu demonstrowania jakości danych, jak prosiłeś. Piszę czysty kod, dotrzymam terminów.
… Czekam na odpowiedź, aby rozpocząć!
-
7 dni1858 PLN
1251 35 1 3 7 dni1858 PLNWitam, jestem gotów wykonać projekt. Mam duże doświadczenie w parsowaniu zasobów internetowych, omijaniu różnych zabezpieczeń typu cloudflare. Proszę pisać na prywatną wiadomość, będę zadowolony z współpracy.
-
5 dni372 PLN
4975 41 4 1 5 dni372 PLNDzień dobry!
Profesjonalnie rozwijam parsery w Pythonie.
Jestem gotów zrealizować Twój projekt + wdrożyć go na serwerze.
Napisz do mnie w wiadomości prywatnej, ustalimy szczegóły.
-
7 dni1115 PLN
324 7 dni1115 PLNRealizuję parsowanie 7 stron z eksportem do Excel/Google Sheets oraz automatyzacją przez GitHub Actions. Mam doświadczenie w omijaniu zabezpieczeń oraz strukturyzowaniu skomplikowanych katalogów na Playwright, jak w moich projektach PromParser i Parser talonów MWS. Gwarantuję czysty kod oraz poprawne przetwarzanie danych.
Aktualne zlecenia dla freelancerów w kategorii Python
Narzędzie do porównywania rachunków z bankiem, kartami i księgowymZadanie techniczne: narzędzie do porównywania rachunków z bankiem, kartami i księgowymOgólny cel Potrzebne jest lokalne narzędzie (skrypt/mała aplikacja w Pythonie), które uruchamiane ręcznie co 1-2 miesiące na moim komputerze i dokonuje porównania między: Rachunkami, które… Python, Aplikacje desktopowe ∙ 11 godzin 9 minut temu ∙ 28 ofert |
Automatyczne publikowanie wideo w mediach społecznościowych według harmonogramuSpecyfikacja techniczna (ST)Automatyczne publikowanie wideo w mediach społecznościowych według harmonogramuOpis projektuPotrzebny jest skrypt/bot (preferowany Python, lub inne rozwiązanie według Twojego wyboru — najważniejsza jest stabilność i łatwość w utrzymaniu), który… Python, Tworzenie chatbota ∙ 23 godziny 12 minut temu ∙ 48 ofert |
Bot do przyjmowania/wyszukiwania ankiet
103 PLN
Krótko mówiąc: Stworzyć bota, w którym będzie można stworzyć i znaleźć ankietę, bot powinien mieć linki referencyjne itd. Wszystko poniżej opisałem.Bot z perspektywy klienta:przed przyciskiem /start tekst na środku czatu:Co może zrobić ten bot?Witamy w Sugar Secret Agency!… Python, Tworzenie chatbota ∙ 1 dzień 1 godzina temu ∙ 55 ofert |
Szukamy dewelopera do stworzenia bota handlowego/bota czatuSzukamy dewelopera do stworzenia bota handlowego / czat-bota. Potrzebny specjalista IT, który będzie w stanie opracować bota do analizy rynku 24/7 i wysyłania sygnałów handlowych dotyczących złota, indeksów, Bitcoin i par Forex. Główne wymaganie - specjalista musi znać się na… Python, Tworzenie chatbota ∙ 1 dzień 20 godzin temu ∙ 41 ofert |
~5 mikroserwisów na FastAPI + poprawki i refaktoryzacja
1301 PLN
Jest projekt składający się z około 11 mikroserwisów na FastAPI z integracjami, który jest w ponad połowie gotowy. Zadanie polega na dokończeniu pozostałych około 5 mikroserwisów (konkretnie - subskrypcje/fakturowanie i integracja z Revenuecat, ochrona przed nadużyciami dla… Python, Programowanie stron internetowych ∙ 2 dni 1 godzina temu ∙ 50 ofert |