Парсер Python3
Здравствуйте.
Есть парсеры сайтов rebuy.de и momox.de используя АПИ, написанные на Python3 и работающие в докере под Убунту.
Проблема есть с сайтом rebuy.de - раз в неделю сайт запускает анализ всех запросов и видит, что была загружена только информация с api, без загрузок html,css,js, картинок и всю подсеть прокси банит целиком.
Пробовали разные прокси, даже вращающиеся с пулами IP 5 миллионов - все равно банят.
Как вариант решения вышеописанной проблемы, может быть уйти от АПИ(так как используя АПИ скрыть что-то нереально) и использовать headless браузеры для парсинга.
Или любую другую технологию/метод - открыт к обсуждению и предложениям!
Главная цель - достичь скорости стабильного парсинга 400-500 товаров/минута на обоих сайтах при вменяемой стоимости прокси - не более 100$/месяц.
Сейчас используются статичные прокси(10 потоков), парсит медленно, но не банит. Когда ставлю выше 10 потоков - банит все сразу с конце недели.
-
786 27 2 2 Доброго дня. Python є основною моєю мовою програмування, тому знаю його досконало (реалізую саме на ньому), маю досвід написання парсерів та роботою з БД, капчами і тд. Зроблю парсер за 15 робочих годин. Реалізую за допомогою Selenium headless.
Також працюю з : Django, Kivy, Pygt5, PySide, Tkinter, Selenium і тд. Пишіть в ЛС, є приклад роботи у портфоліо. Потрібно уточнити декілька моменів в ЛС. Буду радий з вами співпрацювати)
-
115 34 4 2 Здравствуйте.
Имею большой опыт работы с selenium.
Пишите - обсудим детали
Актуальні фриланс-проєкти в категорії Python
Автоматизація процесів через API та PythonНижче описав поточний процес і те, до якого результату хотілося б прийти. Також прикладаю файли реального процесу, щоб краще зрозуміти, як він виглядає в реальності Поточний процес Зараз весь процес виконується вручну: завантаження/вивантаження файлів, перенесення даних… AI та машинне навчання, Python ∙ 33 хвилини тому ∙ 11 ставок |
Потрібно створити бот в тг для оплати підписки.
2000 UAH
Потрібно створити бот в телеграмі де користувач зможе оформити підписку на доступ до веб камер котрі знгаходяться у дворі. Організувати в боті оплату двух видів підписок (на місяць і на один день). Бот повинен автоматично перевірити оплату і після видавати посилання-доступу Python, Розробка ботів ∙ 13 годин 20 хвилин тому ∙ 65 ставок |
Парсинг та класифікація великого масиву зображеньПотрібно реалізувати проєкт зі збору та структурування великого масиву архітектурних зображень із відкритих вебджерел.Задача включає: автоматизований збір зображень; завантаження файлів у максимально доступній якості; класифікацію зображень за категоріями: Exterior; Interior;… Python, Парсинг даних ∙ 20 годин 20 хвилин тому ∙ 30 ставок |
Бізнес-логіка платформи: підтвердження занять, контроль відвідуваності та історія уроків (DjangoДоопрацювання бізнес-логіки освітньої платформи: підтвердження занять, контроль відвідуваності та історія уроків (Django + React) Необхідно реалізувати повноцінну систему підтвердження уроків, контролю відвідуваності та зберігання історії підтверджень. Важливо Перед початком… Python ∙ 3 дні 1 година тому ∙ 29 ставок |
Доопрацювання адміністративної панелі освітньої платформи (Django + React)Доопрацювання адміністративної панелі освітньої платформи (Django + React) Опис проекту: Є діюча освітня платформа (маркетплейс, аналог Preply), розроблена на Django + React. Необхідно доопрацювати існуючу адміністративну панель і реалізувати відсутній функціонал управління… Python, Веб-програмування ∙ 4 дні 22 години тому ∙ 58 ставок |