LinkedIn Scraper na n8n + Google Custom Search + Google Sheets
W tym projekcie opracowałem w pełni zautomatyzowany proces zbierania profili LinkedIn za pomocą:
n8n (platforma bezkodowa/low-code do automatyzacji)
OpenAI GPT-4o-mini do generowania zapytań wyszukiwania
Google Programmable Search Engine (CSE) do scrapowania wyników Google
Google Sheets do przechowywania uzyskanych danych
Co dokładnie zostało wykonane:
Wejściowy czat: użytkownik wysyła wiadomość z tematem wyszukiwania (np. "Marketing managers in Berlin").
Formatowanie AI: za pomocą promptu GPT-4o generowany jest dokładny zapytanie wyszukiwania dla Google CSE.
Paginacja: skrypt w JavaScript dzieli zapytanie na strony, aby zebrać do 500 wyników.
API zapytanie do Google CSE: wysyłane są zapytania do Google w celu uzyskania profili.
Filtrowanie wyników: z odpowiedzi JSON Google wyciągane są tylko linki do profili LinkedIn.
Zapis: wszystkie unikalne linki są dodawane do Google Sheet (z weryfikacją duplikatów).
Rezultat:
Automatycznie zebrano ponad 40 unikalnych profili LinkedIn
Dane starannie zapisane w tabeli
W pełni zarządzane z jednego czatu lub integracji z API
n8n (platforma bezkodowa/low-code do automatyzacji)
OpenAI GPT-4o-mini do generowania zapytań wyszukiwania
Google Programmable Search Engine (CSE) do scrapowania wyników Google
Google Sheets do przechowywania uzyskanych danych
Co dokładnie zostało wykonane:
Wejściowy czat: użytkownik wysyła wiadomość z tematem wyszukiwania (np. "Marketing managers in Berlin").
Formatowanie AI: za pomocą promptu GPT-4o generowany jest dokładny zapytanie wyszukiwania dla Google CSE.
Paginacja: skrypt w JavaScript dzieli zapytanie na strony, aby zebrać do 500 wyników.
API zapytanie do Google CSE: wysyłane są zapytania do Google w celu uzyskania profili.
Filtrowanie wyników: z odpowiedzi JSON Google wyciągane są tylko linki do profili LinkedIn.
Zapis: wszystkie unikalne linki są dodawane do Google Sheet (z weryfikacją duplikatów).
Rezultat:
Automatycznie zebrano ponad 40 unikalnych profili LinkedIn
Dane starannie zapisane w tabeli
W pełni zarządzane z jednego czatu lub integracji z API