Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!

Переделать парсер из реквестов в браузер


  1. 35  
    5 дней2000 UAH

    Готов попробовать реализовать rebuy.de парсер, под windows в программе ехе, поклацал , обошел первичную защиту окна проверку браузера на запросах. , напишите что нужно собирать, что бы я запустил на том этапе что есть у меня и проверил сбор.

  2. 786    27  2   2
    5 дней5000 UAH

    Доброго дня. Python є основною моєю мовою програмування, тому знаю його досконало (реалізую саме на ньому), маю досвід написання парсерів та роботою з БД, капчами і тд. Зроблю парсер за 15 робочих годин. Реалізую за допомогою Selenium headless.
    Також працюю з : Django, Kivy, Pygt5, PySide, Tkinter, Selenium і тд. Пишіть в ЛС, є приклад роботи у портфоліо. Потрібно уточнити декілька моменів в ЛС. Буду радий з вами співпрацювати)

  3. 1 ставка скрыта
  • Олег Б.
    11 ноября 2020, 17:23 |

    Не боїтеся що власник сайту, може рано чи пізно заяву кинути?😁 

  • Олександр Л.
    11 ноября 2020, 17:34 |

    Ваш вопрос не относится к задаче проекта. Задавайте вопросы по существу.

  • Олег Б.
    11 ноября 2020, 17:36 |

    Не питаня по проекту, бомбити 5 запросів на секунду сайт, на постояні основі це не дуже добре

  • Олександр Л.
    11 ноября 2020, 18:20 |

    Это вопрос этики. Сайт публичный,  к нему имеют доступ миллионы людей. В процентном соотношении к общей нагрузке мои запросы = менее 1%.  Сайт рассчитан на эту нагрузку. 

    Законодательные и авторские ограничения, которые установлены правилами сайта соблюдены в полной мере.

    Форум проекта рассчитан на обсуждение по его выполнению, а не дискуссии о морали и правилах.

    Этими вопросами Вы сами же и нарушаете правила Фрилансхант.

    Если Вы такой блюститель правил, начните с себя и соблюдайте их сами прежде всего.


    Прочтите информацию перейдя по ссылке на ПРАВИЛА на форуме проекта:

     "Ставки в форуме проекта запрещены. Также не забудьте ознакомиться с правилами общения. ".

  • Олег Б.
    11 ноября 2020, 18:33 |

    Ви не думали чого вас банять через пару днів , а не зразу.Якщо припустити що там є якась защіта яку ви не обійшли, то сайт має забанити через хвилин 10-30, а тут 4 дня.Може там, злющий власник сайту сидить?І 5 запросів на секунду протягом місяця(року), це не так мало, під такі запроси, можна виділяти окремий сервер😁 

  • Олег Б.
    11 ноября 2020, 21:00 |

    Законодательные и авторские ограничения, которые установлены правилами сайта соблюдены в полной мере.


    Там такі написано 5 запросів на секунду можна, це не DOS,це просто ми вас парсим😁 рік)

  • Профиль удален
    11 ноября 2020, 21:10 |

    У меня вопрос довольно простой. Я так понимаю вас банят раз в 3-4 дня, из-за того что вы парсите весь сайт? Я правильно понимаю?
    Я посмотрел на сайт, и хотелось бы уточнить, какую именно информацию должен грабить парсер, и насколько часто это информация обновляется?

  • Олександр Л.
    11 ноября 2020, 21:40 |

    Банят, раз в 3-4 дня.

    Парсю по категориям.

    Информацию о товарах: титл, дескпришн, цены.

    Обновляется минимум раз в сутки, а то и чаще, но не по всем товарам.


  • Профиль удален
    11 ноября 2020, 21:49 |

    можно ли не проваливаясь в карточку товара определить изменилась ли информация или нет? Как часто нужно парсить этот сайт.

    Сейчас основная проблема в том, что они поставили защиту, как минимум для браузера, с задержкой открытия страницы. Правда с VPN из под немецкого ip я не пробовал заходит, но сам факт защиты есть.

  • Олександр Л.
    11 ноября 2020, 21:52 |

    можно ли не проваливаясь в карточку товара определить изменилась ли информация или нет?

    этого не знаю

    Как часто нужно парсить этот сайт.

    постоянно

    Сейчас основная проблема в том, что они поставили защиту, как минимум для браузера, с задержкой открытия страницы. Правда с VPN из под немецкого ip я не пробовал заходит, но сам факт защиты есть.

    с IP Европа/США/Англия открывается без проверки

    с США быстрее всего

  • Профиль удален
    11 ноября 2020, 22:06 |

    постоянно

    я имею ввиду переодичность. Раз в час, раз в сутки, раз в двое суток.

    этого не знаю

    Здесь вопрос простой. Там каждый товар имеет в url свой уникальный id из их базы данных. По нему можно идентифицировать товар. меня интересует, насколько часто меняется информация по конкретному товару, не считая цены, что бы понимать, возможно ли вообще обойти бан или ограничения за счет, уменьшения количества запросов. к их серверу.


    с IP Европа/США/Англия открывается без проверки

    Проверка все равно есть image

    это с американского ip, проверка появляется меньше, но примерно каждый 4 запрос сделанный в течении 1-2 секунд, выдает это. Так что вам вряд ли удастся не снижая количество запросов, обойти защиту эмуляцией браузера, или не договорившись с владельцем об открытой выгрузке.

  • Олександр Л.
    11 ноября 2020, 22:43 |

    я имею ввиду переодичность. Раз в час, раз в сутки, раз в двое суток.

    выполняется непрерывно, там по 4м интересующим меня категориям в сумме около 6 миллионов товаров, поэтому, как только спарсили все, парсим заново. практически сразу


    Здесь вопрос простой. Там каждый товар имеет в url свой уникальный id из их базы данных. По нему можно идентифицировать товар. меня интересует, насколько часто меняется информация по конкретному товару, не считая цены, что бы понимать, возможно ли вообще обойти бан или ограничения за счет, уменьшения количества запросов. к их серверу.

    информация о товаре не считая цены обновляется редко,но новые товары добавляются каждый день, хоть и немного(около 1000)


    это с американского ip, проверка появляется меньше, но примерно каждый 4 запрос сделанный в течении 1-2 секунд, выдает это. Так что вам вряд ли удастся не снижая количество запросов, обойти защиту эмуляцией браузера, или не договорившись с владельцем об открытой выгрузке.

    может быть Ваш IP shared или недостаточно непрозрачный, либо они усилили защиту.

    Кол-во запросов можно уменьшить, только покупая больше IP, вот нужно найти решение учитывая месячный бюджет на прокси и требуемую сокрость.


    при парсинге запросами мы обращаемся напрямую к АПИ, оно у них открыто


    пытались договориться с владельцем, но не удалось, сказали используйте как есть - use as is 

  • Олег Б.
    11 ноября 2020, 22:48 |

    тіпа власник, знає)цікаво😁 Наверно того там стільки защіти

  • Олег Б.
    11 ноября 2020, 22:50 |

    https://www.rebuy.de/kaufen/suchen?q=s

    нащо вам парсити всьой сайт, ось пошук беріть звідси ціну

  • Олександр Л.
    11 ноября 2020, 22:55 |

    ну хоть одно сообщение по делу!

    теоритически, замечание дельное, только кроме цен и титлов нужны еще описания товаров.

    также, на сайте представлено 4 цены в зависимости от состояний товаров: новый, как новый, бу, плохой бу, которые не вижно по выдаче из поиска


  • Олег Б.
    11 ноября 2020, 22:57 |

    Опис у вас є , вже по ідеї ви вже його раз парсили.

    Ну це рішається, тим що ви вже його раз спарсили і знаєти в яких товарах так, і в ті товари треба заходити

  • Олександр Л.
    11 ноября 2020, 22:59 |

    логично, ну так делайте ставку 😉

  • Олександр Л.
    11 ноября 2020, 22:51 |

    если не можете что-то добавить по решению задачи проекта - не засоряйте форум своими сообщения, пожалуйста.

  • Олег Б.
    11 ноября 2020, 22:55 |

    Решения - це зменшення кількості запросів, за допомогою гібридного парсінга пошука і підкатегорій, і самих карточок, це має зменшити кількість запросів, ,відсотків так на 80

  • Олександр Л.
    11 ноября 2020, 22:56 |

    ну, раз Вы знаете, что и как делать, почему не делаете ставку?

  • Олександр Л.
    11 ноября 2020, 22:56 |

    ну, раз Вы знаете, что и как делать, почему не делаете ставку?

  • Олександр Л.
    11 ноября 2020, 22:56 |

    ну, раз Вы знаете, что и как делать, почему не делаете ставку?

  • Олександр Л.
    11 ноября 2020, 22:56 |

    ну, раз Вы знаете, что и как делать, почему не делаете ставку?

  • Олег Б.
    11 ноября 2020, 22:58 |

    ну поперше там якась бешена защіта, цікава, обійти можна канешно, а по друге вмене немає зараз часу, вмене своїх проектів хватає) на місяць вперед

  • Олександр Л.
    11 ноября 2020, 23:02 |

    ясно, т.е. Вы тут поболтать...

Актуальные фриланс-проекты в категории Python

Настройка двусторонней интеграции WhatsApp с Odoo CRM

Здравствуйте! Ищем специалиста для реализации технического задания по настройке двусторонней интеграции мессенджера WhatsApp с CRM-системой Odoo. ⚠️ Важное техническое уточнение: Официальный WhatsApp Business API (WABA) не рассматривается. Необходимо внедрить стабильное «серое»…

PythonВеб-программирование ∙ 8 часов 20 минут назад ∙ 19 ставок

Парсинг данных через мобильное API

Ищу человека с опытом парсинга данных через мобильное API, для парсинга e-commerce, rozetka и аналоги Задачи: 1. Перехват трафика мобильного приложения (Android) настройка прокси, анализ запросов 2. Определение нужных API endpoints куда идут запросы, какие headers…

PythonПарсинг данных ∙ 2 дня 4 часа назад ∙ 30 ставок

Найти товарный фид (Google Merchant XML) для сайта на OpenCart

700 UAH

Необходимо найти прямую ссылку на действующий товарный фид (XML) конкурента для Google Merchant Center Платформа (CMS): OpenCart / ocStore Найти оригинальный фидТребования к результату: Рабочая ссылка на XML-файл

PythonПарсинг данных ∙ 7 дней 14 часов назад ∙ 29 ставок

Розработка Тик-Ток фермы (контент-завод)

Необзодимо разработать систему для централизованного управления несколькими TikTok-аккаунтами с автоматической публикацией контента, использованием индивидуальных прокси и имитацией естественной активности аккаунтов. Функциональные требования1. Управление аккаунтами Добавление…

PythonРазработка ботов ∙ 8 дней 1 час назад ∙ 22 ставки

Улучшить работу Claude Code и работа с написанием софта

Сейчас разрабатываю СРМ и Аналитику, софт. Делаю через Клод Код, но понимаю что результаты не лучшие в плане изменений. Есть 2 задачи - Нужно помочь сделать пресет по навыкам, мд и так далее чтобы улучшить качество. Взять проверенные с которыми работали, а не с интернета…

AI и машинное обучениеPython ∙ 8 дней 8 часов назад ∙ 28 ставок

Заказчик
Олександр Л.
Украина Харьков  200  0
Проект опубликован
5 лет назад
247 просмотров