Парсінг категорії «розваги» сайту ZOON
Завдяки попередньому аналізу та зворотному інженерігу запитів AJAX вдалося вибрати оптимальний метод екстракції даних з сайту, не звертаючись до використання ресурсоємного рішення на базі Selenium + WebDriver. Парсер стійкий до помилок, і в разі блокування по IP пропонує ручне рішення CAPTCHA.
Завантаження у форматі CSV (15 тис. об'єкти: https://github.com/nik-panekin/zoon_scraper/raw/master/scraping_results.zip
Ключові технології: #Python-3, #requests, #beautifulsoup4
GitHub: https://github.com/nik-panekin/zoon_scraper
Завантаження у форматі CSV (15 тис. об'єкти: https://github.com/nik-panekin/zoon_scraper/raw/master/scraping_results.zip
Ключові технології: #Python-3, #requests, #beautifulsoup4
GitHub: https://github.com/nik-panekin/zoon_scraper