Automatyzacja treści AI dla odzieży — makrofotografia, stylizacja
Zadanie klienta:
Właściciel sklepu internetowego chciał nie tylko jakościowych zdjęć produktów - potrzebował pełnoprawnej treści wizualnej: makrofotografie każdej pozycji, zorganizowane opisy do katalogu oraz żywe zdjęcia modelki w stylizacjach skomponowanych z jego asortymentu. Dodatkowo - możliwość szybkiego przymierzania na gotowym zdjęciu dowolnej nowej rzeczy bez ponownego fotografowania.
Rozwiązanie:
Stworzyłem zautomatyzowany pipeline na n8n z trzech kolejnych modułów, z których każdy wykonuje swoje zadanie i przekazuje wynik dalej.
Jak to działa:
Część 1 - Makrofotografia produktu:
System skanuje folder na Google Drive i pobiera załadowane zdjęcia. Gemini generuje 8 profesjonalnych makrofotografii z czystym białym tłem studyjnym - ogólny widok, detale kroju, faktura tkaniny. Każdy produkt otrzymuje nazwany folder na Google Drive.
Część 2 - Analiza i opis.
Z każdego folderu pobierane jest pierwsze zdjęcie, a GPT-4o mini przeprowadza jego szczegółową analizę: kategoria, kolor i grupa kolorystyczna, formalność, podkategoria, krój, połączenie z innymi rzeczami. Wszystko to jest zapisywane w arkuszu Google i staje się podstawą dla trzeciej części.
Część 3 — Zdjęcie modelki i wymiana rzeczy.
Poprzez bota Telegram klient wybiera modelkę i przesyła rzecz, którą chce przymierzyć do gotowej stylizacji. GPT-4o mini-stylista formuje stylizację: z katalogu wybierany jest top z największym potencjałem, następnie według algorytmu zgodności kolorystycznej i formalności dobierany jest odpowiedni dół. Gemini generuje zdjęcie modelki w tej stylizacji w stylu smart casual. Po tym załadowana przez klienta rzecz automatycznie nakłada się na gotowe zdjęcie - system rozpoznaje jej typ (górna odzież, top lub dół) i wymienia odpowiedni element stylizacji, zachowując twarz, tło i pozę modelki bez zmian.
Wynik dla biznesu:
Klient otrzymuje pełny pakiet wizualny dla każdej pozycji katalogu - od zdjęcia produktowego po stylizację na modelce - bez studia, fotografa i stylisty. Każdą nową rzecz można "przymierzyć" na już gotowym zdjęciu w zaledwie kilka sekund. Treść skalowalna bez zwiększania kosztów.
Liczby:
- 1 wyjściowe zdjęcie → 8 makrofotografii + opis + zdjęcie na modelce
- 4 typy modelek do wyboru
- 3 kategorie odzieży z unikalnymi promptami dla każdej
- 2 warianty końcowego kadru (rzeczy rozpięta / zapięta)
- 0 ręcznych działań po załadowaniu
Stos:
n8n · GPT-4o mini (OpenAI) · Gemini 3.1 Flash (Google AI) · Google Drive API · Google Sheets · Telegram Bot API · JavaScript
Właściciel sklepu internetowego chciał nie tylko jakościowych zdjęć produktów - potrzebował pełnoprawnej treści wizualnej: makrofotografie każdej pozycji, zorganizowane opisy do katalogu oraz żywe zdjęcia modelki w stylizacjach skomponowanych z jego asortymentu. Dodatkowo - możliwość szybkiego przymierzania na gotowym zdjęciu dowolnej nowej rzeczy bez ponownego fotografowania.
Rozwiązanie:
Stworzyłem zautomatyzowany pipeline na n8n z trzech kolejnych modułów, z których każdy wykonuje swoje zadanie i przekazuje wynik dalej.
Jak to działa:
Część 1 - Makrofotografia produktu:
System skanuje folder na Google Drive i pobiera załadowane zdjęcia. Gemini generuje 8 profesjonalnych makrofotografii z czystym białym tłem studyjnym - ogólny widok, detale kroju, faktura tkaniny. Każdy produkt otrzymuje nazwany folder na Google Drive.
Część 2 - Analiza i opis.
Z każdego folderu pobierane jest pierwsze zdjęcie, a GPT-4o mini przeprowadza jego szczegółową analizę: kategoria, kolor i grupa kolorystyczna, formalność, podkategoria, krój, połączenie z innymi rzeczami. Wszystko to jest zapisywane w arkuszu Google i staje się podstawą dla trzeciej części.
Część 3 — Zdjęcie modelki i wymiana rzeczy.
Poprzez bota Telegram klient wybiera modelkę i przesyła rzecz, którą chce przymierzyć do gotowej stylizacji. GPT-4o mini-stylista formuje stylizację: z katalogu wybierany jest top z największym potencjałem, następnie według algorytmu zgodności kolorystycznej i formalności dobierany jest odpowiedni dół. Gemini generuje zdjęcie modelki w tej stylizacji w stylu smart casual. Po tym załadowana przez klienta rzecz automatycznie nakłada się na gotowe zdjęcie - system rozpoznaje jej typ (górna odzież, top lub dół) i wymienia odpowiedni element stylizacji, zachowując twarz, tło i pozę modelki bez zmian.
Wynik dla biznesu:
Klient otrzymuje pełny pakiet wizualny dla każdej pozycji katalogu - od zdjęcia produktowego po stylizację na modelce - bez studia, fotografa i stylisty. Każdą nową rzecz można "przymierzyć" na już gotowym zdjęciu w zaledwie kilka sekund. Treść skalowalna bez zwiększania kosztów.
Liczby:
- 1 wyjściowe zdjęcie → 8 makrofotografii + opis + zdjęcie na modelce
- 4 typy modelek do wyboru
- 3 kategorie odzieży z unikalnymi promptami dla każdej
- 2 warianty końcowego kadru (rzeczy rozpięta / zapięta)
- 0 ręcznych działań po załadowaniu
Stos:
n8n · GPT-4o mini (OpenAI) · Gemini 3.1 Flash (Google AI) · Google Drive API · Google Sheets · Telegram Bot API · JavaScript