Serhii D.
Zaproponuj Serhii pracę nad swoim kolejnym zleceniem.
Ranking
Umiejętności i kwalifikacje
Portfolio
-
67 PLN Rozetka skreping
Parsowanie danychNiezawodny web scraper, gotowy do użycia w środowisku produkcyjnym, przeznaczony do wydobywania danych o laptopach z największej ukraińskiej platformy e-commerce (Rozetka.ua), z automatyczną synchronizacją w chmurze i zaawansowanym omijaniem systemów antybotowych.
Kluczowe cechy techniczne:
… Cloudflare i omijanie botów: Na bazie Playwright i playwright-stealth do symulacji rzeczywistego zachowania człowieka, co pozwala na skuteczne omijanie surowych systemów antybotowych i captcha Turnstile.
Architektura odporna na awarie: Zintegrowana z bazą danych SQLite do śledzenia postępu skanowania strona po stronie. Jeśli skrypt zostanie przerwany lub ulegnie awarii, automatycznie wznawia pracę z tej samej ostatniej strony.
Automatyczna synchronizacja z chmurą: Bezpośrednia integracja z API Google Sheets (gspread) do przesyłania i formatowania danych w czasie rzeczywistym.
Inteligentne filtrowanie: Wstępnie skonfigurowane filtry backendu (SSD 1 TB, cena < 25 000 UAH, konkretne wiodące marki).
Stos technologiczny: Python 3.10+, Playwright, Playwright-Stealth, SQLite, API Google Sheets.
Ten projekt demonstruje klarowną architekturę kodu, prawidłową integrację API, śledzenie stanu bazy danych oraz profesjonalne umiejętności automatyzacji webowej.
-
126 PLN skanowanie eBay
Parsowanie danychAsynchroniczny skryper dla laptopów na eBay, stworzony na bazie Pythona, Playwright, SQLite i API Google Sheets.
Ten projekt automatycznie zbiera dane o laptopach z eBay, wykorzystując dynamiczne renderowanie stron przez proxy-API Scrape.do. Skryper wyciąga szczegółowe informacje o produktach, takie jak nazwa, cena, stan, koszt wysyłki, lokalizacja sprzedawcy, liczba sprzedanych sztuk, opinie o sprzedawcy, status odnowionego produktu oraz adres URL produktu.
… Funkcje:
- Asynchroniczne skanowanie za pomocą Playwright
- Dynamiczne renderowanie JavaScript
- Integracja proxy-API
- Automatyczne przetwarzanie paginacji
- Baza danych SQLite do śledzenia postępu strony
- Automatyzacja eksportu do Google Sheets
- Kontynuacja skanowania z zapisanej strony
- Wyciąganie ustrukturyzowanych danych o produkcie
Stos technologiczny:
- Python
- Playwright
- AsyncIO
- Requests
- SQLite
- API Google Sheets
- gspread
- dotenv
Workflow:
1. Ładowanie zmiennych środowiskowych
2. Inicjalizacja bazy danych SQLite
3. Ładowanie renderowanych stron eBay przez Scrape.do
4. Analiza kart produktów
5. Wyciąganie danych o produktach
6. Zapis produktów w Google Sheets
7. Zapis bieżącego postępu strony
8. Kontynuacja do pełnego skanowania wszystkich stron
Projekt przeznaczony jest do skalowalnych zadań skanowania i automatyzacji w e-commerce.
-
67 PLN Obchodzenie reCaptcha za pomocą bota na Pythonie
Tworzenie chatbotaBot do omijania audio-reCAPTCHA
Narzędzie automatyzacji w Pythonie, które automatycznie rozwiązuje zadania Google reCAPTCHA v2 — ręczne wprowadzanie danych nie jest potrzebne.
… Bot uruchamia prawdziwą przeglądarkę Chromium, imituje zachowanie człowieka z losowymi opóźnieniami i omija mechanizmy wykrywania botów. Gdy pojawia się reCAPTCHA, przechodzi do zadania audio, pobiera plik audio i transkrybuje go za pomocą Google Speech Recognition — a następnie natychmiast wysyła odpowiedź.
Stos technologiczny:
• Playwright — automatyzacja bezgłowego przeglądarki
• pydub + SpeechRecognition — przetwarzanie audio i transkrypcja
• Ochrona przed wykryciem: wyłączona flaga AutomationControlled, podrobiony User-Agent, nadpisanie navigator.webdriver
Cechy:
• Całkowicie zautomatyzowane rozwiązanie od początku do końca
• Interakcja przypominająca ludzką (losowe opóźnienia, prawdziwa przeglądarka)
• Czysty modułowy kod — łatwo integruje się w Twój projekt
• Przetestowane na oficjalnej wersji demonstracyjnej Google reCAPTCHA
-
63 PLN Amazon Skrejpienie
Parsowanie danychIntegracja z Google Sheets w czasie rzeczywistym: wykorzystuje gspread i Batch API do synchronizacji danych bezpośrednio z chmurą bez przekraczania limitów częstotliwości zapytań.
Zachowanie stanu: wbudowana baza danych SQLite do śledzenia postępów, co pozwala skryptowi kontynuować pracę od ostatniej strony w przypadku przerwania.
… Ochrona przed botami: wdrożone własne nagłówki, User-Agents i opóźnienia, które imitują zachowanie człowieka, aby zapewnić stabilne pozyskiwanie danych.
Zautomatyzowane czyszczenie danych: oczyszczone i uporządkowane dane, w tym adresy URL, nagłówki, opcje, oceny i ceny.
-
63 PLN Skrobanie Otodom
Parsowanie danychOpracowano niezawodne, gotowe do wdrożenia narzędzie automatyzacji w Pythonie, specjalnie zaprojektowane do ekstrakcji dużych ilości danych z witryny Otodom.pl. Projekt ten demonstruje wysoki poziom kompetencji w dziedzinie automatyzacji przeglądarek, zarządzania bazami danych oraz strukturyzowania danych.
Kluczowe cechy techniczne:
Stały stan ekstrakcji danych: zintegrowano backend bazy danych SQLite3 do śledzenia postępu ekstrakcji danych. Umożliwia to skryptowi zapamiętanie ostatnio przetworzonej strony, zapewniając natychmiastowe wznowienie pracy po przerwie — krytyczna funkcja dla niezawodnej ekstrakcji danych.
…
Zaawansowana automatyzacja przeglądarki: użyto Playwright do obsługi dynamicznej treści, omijania okienek z prośbą o zgodę na użycie plików cookie oraz symulacji ludzkiej interakcji poprzez płynne przewijanie i losowe opóźnienia.
Czysty pipeline danych: automatycznie wyciąga i oczyszcza złożone pola, w tym nazwę, cenę, cenę za m², powierzchnię, liczbę pokoi oraz lokalizację.
Eksport w czasie rzeczywistym: opracowano system ciągłego eksportu danych, który zapisuje wyniki w Excelu (.xlsx) po każdej stronie, aby zapobiec utracie danych.
Jakość kodu: Opracowano z wykorzystaniem podejścia programowania obiektowego (OOP) dla maksymalnej łatwości konserwacji i skalowalności.
Stos technologiczny:
Backend: Python
Automatyzacja: Playwright (Chromium)
-
59 PLN Auto.ria skanowanie
Parsowanie danychPomyślnie zebrano i usystematyzowano dane dotyczące całego ukraińskiego rynku motoryzacyjnego z zasobu AUTO.RIA.
Główne wyniki:
Wyciągnięto szczegółowe informacje dotyczące wszystkich ogłoszeń o sprzedaży samochodów w kraju.
… Usystematyzowano złożone surowe dane w postaci przejrzystej profesjonalnej tabeli Excel (XLSX) do analizy rynku.
Wdrożono wysokowydajny asynchroniczny skreping do przetwarzania dużych ilości danych.