Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Розмістіть свій проєкт безплатно та почніть отримувати пропозиції від фрилансерів-виконавців уже через хвилини після публікації!

Парсер Python3


  1. 786    27  2   2
    3 дні2500 UAH

    Доброго дня. Python є основною моєю мовою програмування, тому знаю його досконало (реалізую саме на ньому), маю досвід написання парсерів та роботою з БД, капчами і тд. Зроблю парсер за 15 робочих годин. Реалізую за допомогою Selenium headless.
    Також працюю з : Django, Kivy, Pygt5, PySide, Tkinter, Selenium і тд. Пишіть в ЛС, є приклад роботи у портфоліо. Потрібно уточнити декілька моменів в ЛС. Буду радий з вами співпрацювати)

  2. 115    34  4   2
    3 дні1000 UAH

    Здравствуйте.
    Имею большой опыт работы с selenium.
    Пишите - обсудим детали

  3. 1 ставку приховано
    Ще 2 ставки приховано
  • Профіль видалено
    4 жовтня 2020, 15:30 |

    500 товаров в минуту через браузер нереально как по мне (делал один парсер тоже через headless браузер, в среднем секунда-две на страницу), если только организовывать многопоток с разных ip. 

    Сколько запросов идет с одного ip у вас?

  • Олександр Л.
    5 жовтня 2020, 10:26 |

    Я не настаиваю на браузере, думал об этом, как вариант.

    Сейчас с 50 IP парсинг в 100 потоков дает желаемую скорость, но работает это только неделю(4-7 дней), потом сайт банит все IP.

  • Профіль видалено
    5 жовтня 2020, 13:05 |

    50 постоянно работающих ip целую неделю? Я бы такого не советовал делать)
    Сделайте лучше пул из ip побольше, разделите его на 3 и дергайте их на запросы рандомно в разное время суток, чтобы сайт не увидел странного поведения. Я еще добавлял рандомный интервал между запросами с одного ip. И все это через асинхронные запросы, пока одни ip спят, другие работают и тд. Никакого многопотока не требовалось

  • Олександр Л.
    5 жовтня 2020, 13:49 |

    Пробовали работать с вращающимися прокси - сайт банит целую подсеть, и так 5 миоллионов IP в пуле не проработали даже 2х недель.


    Мысль с отдыхает/работает интересная, только вот нужно будет очень много таких IP для достижения скорости в 500 товаров/минута, не выйдет ли это за мой бюджет?

  • Профіль видалено
    5 жовтня 2020, 14:01 |

    Тут уже надо смотреть на сам парсер. 

    Вообще не думаю что вас банят именно из-за использования апи, скорее всего очень много запросов делаете и все они однотипные. Нужно их уникализировать, добавлять интервалы, использовать разные заголовки.

Актуальні фриланс-проєкти в категорії Python

Автоматизація процесів через API та Python

Нижче описав поточний процес і те, до якого результату хотілося б прийти. Також прикладаю файли реального процесу, щоб краще зрозуміти, як він виглядає в реальності Поточний процес Зараз весь процес виконується вручну: завантаження/вивантаження файлів, перенесення даних…

AI та машинне навчанняPython ∙ 33 хвилини тому ∙ 11 ставок

Потрібно створити бот в тг для оплати підписки.

2000 UAH

Потрібно створити бот в телеграмі де користувач зможе оформити підписку на доступ до веб камер котрі знгаходяться у дворі. Організувати в боті оплату двух видів підписок (на місяць і на один день). Бот повинен автоматично перевірити оплату і після видавати посилання-доступу

PythonРозробка ботів ∙ 13 годин 20 хвилин тому ∙ 65 ставок

Парсинг та класифікація великого масиву зображень

Потрібно реалізувати проєкт зі збору та структурування великого масиву архітектурних зображень із відкритих вебджерел.Задача включає: автоматизований збір зображень; завантаження файлів у максимально доступній якості; класифікацію зображень за категоріями: Exterior; Interior;…

PythonПарсинг даних ∙ 20 годин 20 хвилин тому ∙ 30 ставок

Бізнес-логіка платформи: підтвердження занять, контроль відвідуваності та історія уроків (Django

Доопрацювання бізнес-логіки освітньої платформи: підтвердження занять, контроль відвідуваності та історія уроків (Django + React) Необхідно реалізувати повноцінну систему підтвердження уроків, контролю відвідуваності та зберігання історії підтверджень. Важливо Перед початком…

Python ∙ 3 дні 1 година тому ∙ 29 ставок

Доопрацювання адміністративної панелі освітньої платформи (Django + React)

Доопрацювання адміністративної панелі освітньої платформи (Django + React) Опис проекту: Є діюча освітня платформа (маркетплейс, аналог Preply), розроблена на Django + React. Необхідно доопрацювати існуючу адміністративну панель і реалізувати відсутній функціонал управління…

PythonВеб-програмування ∙ 4 дні 22 години тому ∙ 58 ставок

Замовник
Олександр Л.
Україна Харків  200  0
Проєкт опублікований
5 років тому
358 переглядів