Web scraper do zbierania danych profilowych Kaggle
Ten projekt realizuje web scraper oparty na Scrapy, który automatycznie zbiera szczegółowe informacje o profilach użytkowników Kaggle. Analizuje strony profili, wyciąga dane o imieniu, lokalizacji, stanowisku, aktywności w zawodach, zestawach danych, notebookach, dyskusjach, a także informacje o subskrybentach i subskrypcjach. Dodatkowo parser znajduje i klasyfikuje zewnętrzne linki, takie jak GitHub, LinkedIn, Twitter lub osobista strona internetowa. Dzięki funkcjom przetwarzania HTML scraper poprawnie wyciąga dane biograficzne. Projekt zapewnia efektywne zbieranie i strukturyzację danych do dalszej analizy aktywności użytkowników Kaggle.