Парсер Python3
Здравствуйте.
Есть парсеры сайтов rebuy.de и momox.de используя АПИ, написанные на Python3 и работающие в докере под Убунту.
Проблема есть с сайтом rebuy.de - раз в неделю сайт запускает анализ всех запросов и видит, что была загружена только информация с api, без загрузок html,css,js, картинок и всю подсеть прокси банит целиком.
Пробовали разные прокси, даже вращающиеся с пулами IP 5 миллионов - все равно банят.
Как вариант решения вышеописанной проблемы, может быть уйти от АПИ(так как используя АПИ скрыть что-то нереально) и использовать headless браузеры для парсинга.
Или любую другую технологию/метод - открыт к обсуждению и предложениям!
Главная цель - достичь скорости стабильного парсинга 400-500 товаров/минута на обоих сайтах при вменяемой стоимости прокси - не более 100$/месяц.
Сейчас используются статичные прокси(10 потоков), парсит медленно, но не банит. Когда ставлю выше 10 потоков - банит все сразу с конце недели.
-
786 27 2 2 Доброго дня. Python є основною моєю мовою програмування, тому знаю його досконало (реалізую саме на ньому), маю досвід написання парсерів та роботою з БД, капчами і тд. Зроблю парсер за 15 робочих годин. Реалізую за допомогою Selenium headless.
Також працюю з : Django, Kivy, Pygt5, PySide, Tkinter, Selenium і тд. Пишіть в ЛС, є приклад роботи у портфоліо. Потрібно уточнити декілька моменів в ЛС. Буду радий з вами співпрацювати)
-
115 34 4 2 Здравствуйте.
Имею большой опыт работы с selenium.
Пишите - обсудим детали
Current freelance projects in the category Data Parsing
Need a parser for the online store https://www.lcsc.com/It is necessary to regularly (once a month, or upon script launch) obtain up-to-date information about the products available in the store. https://www.lcsc.com/ from the catalog of all sections.… Data Parsing ∙ 40 minutes back ∙ 14 proposals |
OpenCart — rental catalog of special equipment
135 USD
OpenCart — Equipment Rental Catalog Need to launch an equipment rental catalog on OpenCart. Theme: excavators cherry pickers forklifts generators cranes scaffolding other construction equipment. It is preferable that you already have a ready-made template or developments… Web Programming, Data Parsing ∙ 17 hours 6 minutes back ∙ 43 proposals |
Transfer the program - the server where the program was located has crashed (officially permitted parsing of government data)
47 USD
Hello! My client has encountered the case described below. We need help transferring to a new server and testing the program. It would be better to have a programmer who understands parsing. Software & Server Configuration, Data Parsing ∙ 20 hours 59 minutes back ∙ 25 proposals |
Parsing and classification of a large array of imagesIt is necessary to implement a project for collecting and structuring a large array of architectural images from open web sources.The task includes: automated collection of images; uploading files in the highest available quality; classification of images by categories:… Python, Data Parsing ∙ 21 hours 27 minutes back ∙ 30 proposals |
Parsing Resumes from Work.ua and Rabota.uaIt is necessary to download a database of current resumes from Work.ua and Rabota.ua in Excel format. It is preferable that the Excel file contains the following columns: Name Phone number (in the format +380...) Email Position (profession) Positions considered Category of… Information Gathering, Data Parsing ∙ 1 day 21 hours back ∙ 18 proposals |