Парсер украинской доски объявлений OLX.ua
Разработана программа (в виде консольного приложения), осуществляющая сбор всей основной информации по объявлениям сайта OLX (в том числе, номеров телефонов пользователей). Изначально написана на языке Python для платформы Windows, хотя портирование под Linux особых сложностей составить не должно.
Для работы приложения необходимо предоставить список учётных записей OLX, с которых будет производиться авторизация для доступа к защищённым данным через API. Дополнительные прокси не требуются, так как, по возможности, используются ресурсы сети TOR.
Полученные данные сохраняются в форматах JSON, CSV и XLSX. Есть возможность сохранять также изображения из объявлений.
Видеодемонстрация работы: https://youtu.be/hUFKrMFm7wc
Данная программа является проектом с открытым кодом (open source) и распространяется по свободной лицензии. Исходных код доступен в репозитории GitHub: https://github.com/nik-panekin/olx_scraper
Ключевые слова: #python, #requests, #beautifulsoup4, #selenium, #web-scraping, #parsing, #olx
Для работы приложения необходимо предоставить список учётных записей OLX, с которых будет производиться авторизация для доступа к защищённым данным через API. Дополнительные прокси не требуются, так как, по возможности, используются ресурсы сети TOR.
Полученные данные сохраняются в форматах JSON, CSV и XLSX. Есть возможность сохранять также изображения из объявлений.
Видеодемонстрация работы: https://youtu.be/hUFKrMFm7wc
Данная программа является проектом с открытым кодом (open source) и распространяется по свободной лицензии. Исходных код доступен в репозитории GitHub: https://github.com/nik-panekin/olx_scraper
Ключевые слова: #python, #requests, #beautifulsoup4, #selenium, #web-scraping, #parsing, #olx