Parzer ukraińskiej płyty ogłoszeń OLX.ua
Opracowana jest aplikacja (w postaci aplikacji konsularnej), która gromadzi wszystkie podstawowe informacje na temat reklam na stronie OLX (w tym numery telefonów użytkowników).Początkowo napisane w języku Python dla platformy Windows, chociaż portowanie pod Linuxem nie powinno stanowić szczególnych trudności.Aby aplikacja mogła działać, należy podać listę kont OLX, z których uzyskuje się zezwolenie na dostęp do zabezpieczonych danych za pośrednictwem API.Dodatkowe proxy nie są wymagane, ponieważ w miarę możliwości wykorzystywane są zasoby sieci TOR.Zebrane dane są przechowywane w formach JSON, CSV i XLSX.Istnieje również możliwość przechowywania obrazów z reklam.Wyświetlanie wideo: https://youtu.be/hUFKrMFm7wc
Program ten jest projektem open source i jest rozpowszechniany na wolną licencję.Kod źródłowy jest dostępny w magazynie GitHub: https://github.com/nik-panekin/olx_scraper
Słowa kluczowe: #python, #requests, #beautifulsoup4, #selenium, #web-scraping, #parsing, #olx
Program ten jest projektem open source i jest rozpowszechniany na wolną licencję.Kod źródłowy jest dostępny w magazynie GitHub: https://github.com/nik-panekin/olx_scraper
Słowa kluczowe: #python, #requests, #beautifulsoup4, #selenium, #web-scraping, #parsing, #olx