Hybrydowy Workflow (Scraping + Claude 3.5 API) do masowej generacji kart produktów
Szukam doświadczonego dewelopera/integratora n8n do stworzenia zautomatyzowanego procesu dla e-commerce.
Istota zadania: System ma pobierać minimalne dane wejściowe z Google Sheets (linki do źródeł + surowy tekst), przeprowadzać parsowanie, przetwarzać zbiór danych przez wieloagentowy system AI i generować gotowy plik XML/YML do importu na marketplace.
Stos technologiczny: n8n (na VPS), Google Sheets / Drive API, Claude 3.5 Sonnet API, bramy do parsowania (ScrapeOps / ZenRows lub analogi).
Krótki algorytm pracy (4 etapy):
Inicjalizacja: Odczytanie wiersza w tabeli, tworzenie folderów dla mediów na Google Drive.
Parsowanie: Ominięcie zabezpieczeń Cloudflare na stronach źródłowych. Zbieranie zdjęć, marek i cech (w zbiorze klucz-wartość). Zbieranie tekstów konkurencji.
Generacja AI (Claude API): Połączony zbiór danych przechodzi przez 3 kolejne węzły AI (praca ściśle w trybie JSON). AI wyciąga fakty, dopasowuje kategorie według naszych słowników, pisze SEO-optymalizowany tekst HTML w dwóch językach i formuje tagi.
Eksport: Zbieranie wszystkich danych w gotowy plik XML/YML (lub osobny arkusz Google Sheets) z ustawieniem sztywnych komercyjnych domyślnych wartości (waluta, saldo 0 itd.). Ustawienie obsługi błędów (aby w przypadku błędu parsera workflow zapisywał log i kontynuował, a nie padał).
Warunki: Mam całkowicie napisane, maksymalnie szczegółowe wymagania. Nie będziesz musiał wymyślać logiki, architektury dopasowania ani pisać systemowych promptów dla AI - wszystko to jest już gotowe i zostanie przekazane wykonawcy. Twoim zadaniem jest poprawne złożenie tych węzłów w n8n, skonfigurowanie stabilnego przesyłania danych oraz podłączenie serwerów/proxy.
Podaj od razu swój Telegram oraz odpowiedź na 2 krótkie pytania:
Jaką usługę/podejście wykorzystałbyś w n8n do parsowania strony, która jest chroniona Cloudflare?
Jak skonfigurowałbyś zapytanie do Claude API, aby zapewnić, że zawsze zwróci stabilną strukturę danych (np. dla tagów czy kategorii), która nie złamie kolejnych węzłów w n8n?
Czekam na Twoje odpowiedzi z wstępną oceną terminów i budżetu!
Załączniki 1
Opinia zleceniodawcy o współpracy z Illia Dunaiev
Hybrydowy Workflow (Scraping + Claude 3.5 API) do masowej generacji kart produktów-
Nie przekazuję przez Telegram - za to na giełdzie mogą zablokować obie strony =/ Lepiej na razie prowadzić wszystko tutaj.
Co do Cloudflare, nie robiłbym głównego parsowania lokalną przeglądarką na VPS. W n8n podłączyłbym ZenRows lub ScrapeOps przez HTTP Request z renderowaniem JS, zarządzanymi proxy, limitami, powtórkami i normalnym logowaniem. Jeśli donory są bardzo różne - przeniósłbym parser do osobnej usługi, a n8n zostawiłbym jako orkiestrator.
Dla API Claude nie polegałbym tylko na promptach. Stabilność osiąga się przez użycie narzędzi z JSON schema, temperatura 0, lista dozwolonych kategorii i tagów, weryfikacja schematu w n8n, powtórzenie zapytania w przypadku błędu oraz kwarantanna wiersza, jeśli model ponownie zwrócił nieprawidłowe dane. Wtedy następne węzły otrzymują tylko zweryfikowane pola.
Ocena czasowa - 10-14 dni roboczych po uzyskaniu dostępu i testowych donorów. Co do budżetu, pełna budowa takiego konwejera raczej od 45 000 zł. !!6500 zł wystarczy na krótki prototyp lub audyt TŻ!!, nie na stabilne ustawienie z logami, feedem, proxy i obsługą błędów.
Moje podejście - najpierw uruchomić podstawowy łańcuch na 1-2 donorach, sprawdzić schemat danych, potem dodać słowniki kategorii, generację w dwóch językach, budowę XML/YML i monitorowanie błędów. Nie komplikujemy tam, gdzie n8n działa normalnie, ale przeniesiemy kod, co w węzłach stanie się kruchym.
…
Należy doprecyzować
> ile donorów i produktów dziennie trzeba przetwarzać
> słowniki kategorii w TŻ - to ID marketplace'u czy tekstowe nazwy, które jeszcze trzeba dopasować
Podobne przykłady
> https://business.ingello.com/prime-eva - e-commerce i procesy produktowe, bliskie feedom i automatyzacji operacyjnej
> https://business.ingello.com/vorfahr - automatyzacja AI z przetwarzaniem danych i sekwencyjną logiką
> https://systems-fl.ingello.com/ua - nasza strona FLH dotycząca systemowego rozwoju, integracji i automatyzacji
-
496 1 0 Dzień dobry! 3. miejsce solo na AI Agent Olympics Hackathon (AI Week 2026 Mediolan, największe wydarzenie AI w Europie, 731 zespołów). Produkcja systemów multi-agent + RAG na n8n + Claude - główny stos technologiczny, MSc Strategic PM, PRINCE2.
W sprawach:
Cloudflare bypass: Scrapfly lub ZenRows jako główny brama przez węzeł HTTP Request (rotacja IP residential + fingerprinting przeglądarki, ~65% pokrycia domen w 2026). Bright Data jako fallback w trudnych domenach. ScrapeOps też jest działającą opcją, ale tańszy Scrapfly zazwyczaj daje lepszy wskaźnik sukcesu na Cloudflare/DataDome.
Stabilny JSON od Claude: używam natywnego Structured Outputs (output_config.format z JSON schema) - to oficjalna funkcja API Claude, nie inżynieria promptów. Gwarantuje ważny JSON zgodny ze schematem, następne węzły w n8n nie padają. Dodatkowo fallback: węzeł JSON Parse z try/catch + retry z temperaturą 0. Przy okazji, do produkcji polecam Sonnet 4.6 lub Opus 4.7 zamiast 3.5 - lepsza zgodność JSON i tańszy za token na 4.6.
Orientacyjnie: 7-10 dni, 15 000 zł.
…
Portfolio w profilu.
-
919 4 0 Cześć, Georgi, swój ostatni projekt zrealizowałem właśnie z wykorzystaniem scrapling i integracji LLM. Zróbmy to po kolei: 1. Do integracji z Google Sheets można użyć węzła z oficjalnym API. 2. Obejście captcha, obecnie są dwa podejścia, które działają: 1) Używać scrapling z ich wbudowanym DynamicFetcher z ustawieniem stealthy. 2) Używać z CDP do CloakBrowser — najpewniejsze. 3. Można podłączyć na trzy sposoby: 1) Napisać lekki backend i się do niego odwoływać (pewne i stabilne) 2) Napisać własny węzeł (czasochłonne) 3) Używać węzła Execute Command (ale to mniej stabilne niż pierwsza opcja) 4. Dla odpowiedzi llm są wbudowane walidacje structure output. Można również podłączyć się przez openrouter (mają dodatkową ochronę dla tego). Tak więc, moją zalecaną opcją jest stworzenie własnego małego backendu i odwoływanie się do niego, używając n8n. To dobrze wpisuje się w logikę, którą opisałeś. Będę zadowolony, mogąc z Tobą pracować!
-
3067 11 0 1 Dzień dobry, Georgij!
Specjalizuję się w opracowywaniu zautomatyzowanych systemów AI/workflow, integracjach oraz budowie pipeline'ów na n8n z wykorzystaniem modeli LLM, parserów i zewnętrznych API. Pracuję nad zadaniami, w których ważna jest stabilność przetwarzania danych, skalowalność i kontrola struktury między węzłami. Twój przypadek wygląda na dobrze przemyślany pipeline produkcyjny, a to właśnie taki format zadań, w którym n8n sprawdza się bardzo dobrze jako warstwa orkiestracyjna.
Aby sformułować dla Ciebie obiektywną ocenę pod względem terminów i kosztów, chciałbym wyjaśnić kilka kwestii:
— Jaki orientacyjny wolumen przetwarzania planowany jest (towarów / donorów na dobę)?
— Czy wszyscy donatorzy są jednorodni pod względem struktury, czy potrzebne będzie osobne mapowanie/parsing dla różnych stron?
— Czy feed XML/YML jest formowany pod konkretny marketplace, czy pod własny standard?
… — Czy potrzebne jest cache'owanie/zapisywanie pośrednich wyników (np. parsed raw data lub AI output)?
— VPS już jest uruchomiony pod n8n, czy to również trzeba skonfigurować?
Jeśli chodzi o Twoje pytania:
Aby obejść Cloudflare w n8n, użyłbym ScrapeOps lub ZenRows z rotacją proxy i renderowaniem w przeglądarce. Jeśli donatorzy są bardziej skomplikowani — Playwright/Puppeteer przez osobny mikroserwis, który n8n wywołuje webhookiem. To zapewnia znacznie stabilniejszy przepływ parsowania w produkcji.
Dla API Claude użyłbym surowego trybu JSON pod walidację schematu: wyraźny system prompt + zdefiniowany schemat JSON + dodatkowa warstwa walidacji w n8n (IF/Function node), aby żaden niepoprawny response nie łamał kolejnych węzłów. Dla krytycznych struktur (kategorie, tagi) — dodatkowo logika fallback/retry.
Po Twoich odpowiedziach będę mógł dokładnie ocenić zakres prac, zaproponować optymalną architekturę oraz podać realistyczne terminy i budżet.
Georgij, proponuję omówić szczegóły w wiadomościach prywatnych — mogę pomóc w zbudowaniu nie tylko workflow, ale stabilnego pipeline'u gotowego do produkcji, który będzie skalowalny bez ciągłych ręcznych poprawek.
-
976 4 0 Dzień dobry
Nazywam się Dmytro. Mam doświadczenie z n8n, automatyzacją AI, API Claude, parsowaniem, orkiestracją workflow oraz automatyzacją e-commerce.
Wasz pipeline wygląda na bardzo dobrze zbudowany — szczególnie podoba mi się podejście z AI flow tylko w JSON oraz podział logiki na etapy.
Mogę pomóc w:
— budowie i stabilizacji workflow n8n
— integracji API Google Sheets/Drive
— orkiestracji API Claude
— parsowaniu z obejściem Cloudflare
— generacji feedów XML/YML
… — obsłudze błędów / logice ponownego próbowania
— przetwarzaniu kolejek
— wdrożeniu VPS i konfiguracji proxy
Odpowiedzi na pytania:
1. Do parsowania Cloudflare w n8n najlepiej użyłbym ZenRows lub ScrapeOps + strategię zapasową przez rotacyjne proxy/renderowanie w przeglądarce. W przypadku skomplikowanych przypadków — węzeł przeglądarki bez interfejsu (Playwright/Puppeteer przez zewnętrznego pracownika).
2. Dla API Claude użyłbym podejścia z rygorystycznym schematem JSON:
— system prompt z sztywną strukturą
— tryb JSON / wstępnie wypełniony szablon odpowiedzi
— węzeł walidacji po Claude
— parser zapasowy + automatyczne ponowne próbowanie przy nieprawidłowym JSON
— enumy/dozwolone wartości dla kategorii i tagów
Tak workflow nie będzie łamać następnych węzłów.
Co do terminów: orientacyjnie 1–3 tygodnie w zależności od złożoności parserów i liczby źródeł donorów.
Budżet: po przeglądzie pełnego TŻ.
-
1904 29 1 1 Cześć! Mam odpowiednie doświadczenie w podobnych zadaniach i mogę pomóc w Twoim projekcie. Mogę szybko zapoznać się z wymaganiami, zaproponować najlepsze rozwiązanie i starannie wykonać pracę. Jestem gotów omówić szczegóły i zacząć.
-
650 2 0 Dzień dobry! 👋
W sprawie Państwa pytań:
Do obejścia Cloudflare — ZenRows lub ScraperAPI przez węzeł HTTP Request z rotacją proxy.
Stabilna struktura od Claude — system prompt z sztywną schemą JSON + temperatura: 0 + walidacja w węźle Function z ponownym zapytaniem przy niewalidnym JSON.
Realizujemy w pełni — wszystkie 4 etapy od odczytu Google Sheets do gotowego pliku XML/YML. Jesteśmy gotowi zająć się tym od razu. Szczegóły omówimy osobiście 🤝
-
253 Cześć! Jesteśmy zespołem deweloperów z 4-letnim doświadczeniem w tworzeniu botów, automatyzacji procesów oraz profesjonalnym parsowaniu danych w Pythonie. Hybrydowe przepływy pracy oparte na Claude 3.5 to jeden z najlepszych sposobów na jakościowe pozyskiwanie i strukturyzowanie często zmieniających się informacji. Weźmiemy na siebie pełny cykl: od napisania niezawodnego skrapera (skryptów omijających blokady) po integrację sieci neuronowej do inteligentnej analizy zebranych treści. Ponieważ jesteśmy zespołem, otrzymasz przetestowane i odporne na awarie rozwiązanie pod klucz z przemyślaną architekturą. Porozmawiajmy w wiadomościach prywatnych o objętości danych i docelowych stronach, aby dokładnie dostosować system!
-
256 Cześć! Nasz zespół ma 4-letnie doświadczenie w dziedzinie automatyzacji, parsowania danych i tworzenia inteligentnych botów. Specjalizujemy się w Pythonie i budowie złożonych systemów zbierania informacji, dlatego integracja Claude 3.5 do przetwarzania danych nieustrukturyzowanych w hybrydowym workflow to nasze główne zadanie. Doskonale rozumiemy, jak optymalizować prompt, omijać zabezpieczenia stron internetowych za pomocą proxy oraz konfigurować elastyczną logikę filtrowania treści przez API Antropic. Zapewnimy czysty kod, wysoką prędkość parsowania, ochronę danych oraz stabilną pracę architektury przy wszelkich zmianach struktury docelowych zasobów. Jesteśmy gotowi omówić logikę pipeline'u i format danych wyjściowych już teraz. Kiedy będzie Ci wygodnie porozmawiać na czacie?
-
2008 36 3 Dzień dobry, bez problemu zrealizuję wszystko pod klucz, mam ponad 5 lat doświadczenia w automatyzacji rozwiązań biznesowych w Pythonie, pracowałem z dużymi markami i opracowałem ponad 50 automatyzacji, z i bez AI, chciałbym dokładniej przyjrzeć się specyfikacji technicznej, jeśli została napisana przez AI, 70% będzie trzeba przerobić, ponieważ często nieprawidłowo dobierają technologie lub rozwiązania. Poprowadzę przez każdy etap, odpowiem na wszelkie pytania. Proszę o kontakt!
-
10038 117 0 Witam.
Mogę skonfigurować dla Ciebie workflow. Pisz, omówimy.
-
196 mamy już prawie gotowe podobne rozwiązanie do generacji kart i feedów AI, które można szybko dostosować do waszych tabel, darczyńców i zasad marketplace'u ))
co do terminów, orientowałbym się na 5-7 dni na pierwszy stabilny etap.
co do budżetu - od 18000 UAH za roboczy konwejer w n8n z logami, ustrukturyzowanym JSON i eksportem do XML lub YML.
6500 UAH, najprawdopodobniej, wystarczy tylko na prototyp bez normalnego zapasu na błędy parsowania.
na Telegram nie będę mógł przejść w ramach pierwszego kontaktu - giełda może zbanować obie strony.
możemy wszystko uzgodnić tutaj.
… co do Cloudflare, używałbym ZenRows, ScrapeOps lub Apify z renderowaniem w przeglądarce, rotacją proxy, ponownymi próbami i cache'em wyników.
co do API Claude - przez surową schemę danych.
Ustawiłbym oddzielne węzły walidacji po każdym kroku AI, schemat JSON, ograniczoną listę kategorii ze słowników, ponowne zapytanie przy niewłaściwej strukturze i zapasowy scenariusz, gdy pole nie jest zdefiniowane.
Tak, aby następne węzły n8n nie łamały się przez zbędny przecinek lub nieoczekiwany format.
> pytanie 1 - w waszym Tz już zadany końcowy format feedu pod konkretny marketplace czy trzeba będzie zweryfikować obowiązkowe pola na etapie realizacji
> pytanie 2 - ilu darczyńców i mniej więcej ile produktów trzeba przetwarzać przy jednym uruchomieniu
podobne przypadki Ingello
> https://business.ingello.com/vorfahr - automatyzacja z AI i przetwarzaniem danych
> https://business.ingello.com/prime-eva - e-commerce i systemowa praca z danymi produktowymi
> https://business.ingello.com/fractal - procesy wieloagentowe i złożone automatyzacje
strona główna dla FLH
> https://systems-fl.ingello.com/ua
mogę zająć się pierwszym etapem - zebrać roboczy scenariusz w n8n, podłączyć tabelę, parser, Claude, walidację JSON, logowanie błędów i testowy eksport feedu.
na łączach ))
-
726 9 1 Witam! Zbadałem twój projekt i jestem gotów natychmiast przystąpić do pracy. Gwarantuję doskonałą jakość i szybkość.
-
1318 2 0 Witam. Cztery etapy z obejściem Cloudflare i trzema sekwencyjnymi węzłami Claude w trybie JSON to nie typowy przepływ n8n, tutaj trzeba myśleć o logice ponownego próbowania i obsłudze przypadków brzegowych na poziomie danych, a nie tylko łączyć węzły. W ciągu ostatniego roku zbudowałem dwa podobne potoki dla e-commerce: jeden na ScrapeOps + n8n dla 800+ SKU dziennie, drugi z ZenRows + OpenRouter do wielordzeniowego parsowania. Oba generują feedy YML bez ręcznej interwencji. Dla Cloudflare - ZenRows z renderowaniem JS, ponieważ ScrapeOps często budzi się na trudnych wyzwaniach. Dla stabilnego JSON od Claude - osobny system prompt z przykładem (few-shot) plus węzeł walidacji przez schemat zod przed przekazaniem dalej; jeśli Claude zwraca uszkodzony JSON - węzeł łapie, loguje i rzuca na ponowne próbowanie z temperaturą 0.1. Co do terminów - 3-5 dni roboczych, ponieważ specyfikacja jest już gotowa, ale obejście Cloudflare zawsze wymaga testowania na rzeczywistych donorach. Pytanie: ile mniej więcej stron-donorów jest w puli i czy są wśród nich takie, które używają PerimeterX lub DataDome? To wpłynie na wybór bramy i liczbę testowych iteracji.
-
Що з бюджетами тут сталось, чому всі хочуть купити хогвартс по ціні однушки у Житомирі...
-
Aktualne zlecenia dla freelancerów w kategorii Bazy danych i SQL
Potrzebny specjalista 1C do poprawek i rozwojuSzukam specjalisty z 1C do współpracy na freelansie. Obecnie już współpracuję z wykonawcą, który zapewnia wsparcie i obsługę systemu 1C. Jednak z powodu obciążenia wykonawcy pojawia się potrzeba szybkiego wykonania dodatkowych zadań, poprawek oraz opracowania nowej… Bazy danych i SQL ∙ 4 godziny 36 minut temu ∙ 9 ofert |
Rozwój jądra Backend (Python), silnika FSM Telegram i integracja StripePoszukujemy doświadczonego programisty Backend (Middle/Senior) do stworzenia niezależnego rdzenia Headless produktu EdTech. System działa na modelu miesięcznej, ścisłej subskrypcji. Logika rdzenia musi być całkowicie izolowana od treści. Cała rozwój odbywa się wyłącznie w… Python, Bazy danych i SQL ∙ 10 godzin 46 minut temu ∙ 23 oferty |
Przywracanie Instagrama po zablokowaniu3 marca 2026 r. zablokowano Instagram z powodu naruszenia zasad. Uważam, że doszło do jakiegoś błędu, ponieważ strona była osobista z zdjęciami i filmami z prywatnych podróży. Nie pisałam komentarzy ani niczego innego. Wysłałam kilka razy odwołanie. Nie mogę pobrać swoich… Bazy danych i SQL, Programowanie stron internetowych ∙ 15 godzin 43 minuty temu ∙ 4 oferty |
Należy załadować towary do odpowiednich kategorii i podkategorii z plików SQLStrona została stworzona na WP. Znajduje się w niej katalog produktów. Wgrywano towary z pliku pdf, częściowo wyszła kasza. Jest trzy pliki z wyraźnym podziałem kategorii, podkategorii i produktów w nich. W pliku PA.sql kategorie są ponumerowane, na przykład na stronie… Bazy danych i SQL, Programowanie stron internetowych ∙ 19 godzin 14 minut temu ∙ 31 ofert |
System CRM dla logistyki kolejowejStworzenie systemu CRM dla firmy logistycznej, głównie zajmującej się transportem kolejowym i drogowym, 1) Raportowanie finansowe 2) Przetwarzanie wniosków 3) Kontrahenci 4) Automatyczne wystawianie faktur i aktów zamknięcia, można stworzyć uproszczony system 1C poniżej… Bazy danych i SQL, Zarządzanie klientami i CRM ∙ 1 dzień 3 godziny temu ∙ 36 ofert |