Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Post your project for free and start receiving proposals from freelancers within minutes after publication!

Парсер Python3


  1. 786    27  2   2
    3 days56 USD

    Доброго дня. Python є основною моєю мовою програмування, тому знаю його досконало (реалізую саме на ньому), маю досвід написання парсерів та роботою з БД, капчами і тд. Зроблю парсер за 15 робочих годин. Реалізую за допомогою Selenium headless.
    Також працюю з : Django, Kivy, Pygt5, PySide, Tkinter, Selenium і тд. Пишіть в ЛС, є приклад роботи у портфоліо. Потрібно уточнити декілька моменів в ЛС. Буду радий з вами співпрацювати)

  2. 115    34  4   2
    3 days23 USD

    Здравствуйте.
    Имею большой опыт работы с selenium.
    Пишите - обсудим детали

  3. 1 proposal concealed
    Another 2 proposals concealed
  • Profile deleted
    4 October 2020, 15:30 |

    500 товаров в минуту через браузер нереально как по мне (делал один парсер тоже через headless браузер, в среднем секунда-две на страницу), если только организовывать многопоток с разных ip. 

    Сколько запросов идет с одного ip у вас?

  • Oleksandr L.
    5 October 2020, 10:26 |

    Я не настаиваю на браузере, думал об этом, как вариант.

    Сейчас с 50 IP парсинг в 100 потоков дает желаемую скорость, но работает это только неделю(4-7 дней), потом сайт банит все IP.

  • Profile deleted
    5 October 2020, 13:05 |

    50 постоянно работающих ip целую неделю? Я бы такого не советовал делать)
    Сделайте лучше пул из ip побольше, разделите его на 3 и дергайте их на запросы рандомно в разное время суток, чтобы сайт не увидел странного поведения. Я еще добавлял рандомный интервал между запросами с одного ip. И все это через асинхронные запросы, пока одни ip спят, другие работают и тд. Никакого многопотока не требовалось

  • Oleksandr L.
    5 October 2020, 13:49 |

    Пробовали работать с вращающимися прокси - сайт банит целую подсеть, и так 5 миоллионов IP в пуле не проработали даже 2х недель.


    Мысль с отдыхает/работает интересная, только вот нужно будет очень много таких IP для достижения скорости в 500 товаров/минута, не выйдет ли это за мой бюджет?

  • Profile deleted
    5 October 2020, 14:01 |

    Тут уже надо смотреть на сам парсер. 

    Вообще не думаю что вас банят именно из-за использования апи, скорее всего очень много запросов делаете и все они однотипные. Нужно их уникализировать, добавлять интервалы, использовать разные заголовки.

Current freelance projects in the category Data Parsing

Need a parser for the online store https://www.lcsc.com/

It is necessary to regularly (once a month, or upon script launch) obtain up-to-date information about the products available in the store. https://www.lcsc.com/ from the catalog of all sections.…

Data Parsing ∙ 40 minutes back ∙ 14 proposals

OpenCart — rental catalog of special equipment

135 USD

OpenCart — Equipment Rental Catalog Need to launch an equipment rental catalog on OpenCart. Theme: excavators cherry pickers forklifts generators cranes scaffolding other construction equipment. It is preferable that you already have a ready-made template or developments…

Web ProgrammingData Parsing ∙ 17 hours 6 minutes back ∙ 43 proposals

Transfer the program - the server where the program was located has crashed (officially permitted parsing of government data)

47 USD

Hello! My client has encountered the case described below. We need help transferring to a new server and testing the program. It would be better to have a programmer who understands parsing.

Software & Server ConfigurationData Parsing ∙ 20 hours 59 minutes back ∙ 25 proposals

Parsing and classification of a large array of images

It is necessary to implement a project for collecting and structuring a large array of architectural images from open web sources.The task includes: automated collection of images; uploading files in the highest available quality; classification of images by categories:…

PythonData Parsing ∙ 21 hours 27 minutes back ∙ 30 proposals

Parsing Resumes from Work.ua and Rabota.ua

It is necessary to download a database of current resumes from Work.ua and Rabota.ua in Excel format. It is preferable that the Excel file contains the following columns: Name Phone number (in the format +380...) Email Position (profession) Positions considered Category of…

Information GatheringData Parsing ∙ 1 day 21 hours back ∙ 18 proposals

Client
Oleksandr L.
Ukraine Kharkiv  200  0
Project published
5 years back
358 views