Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!
1 500 ₴

Создать парсер

закрыт без выполнения



Задача: 

Необходимо спарсить все магазины с маркетплейса : aliexpress.com


Особености: 

Парсер должен уметь загружать прокси из текстового файла

Работать в минимум 500 потоков 


 или же необходимо сделать парсер так что бы его можно было запускать на разных серверах - на каждую суб категорию свой сервер 


Параметры для структурирования БД : 

(поля) 

Категория 

Суб-категория 

Название магазина

Ссылка на продавца 


Дата регистрации

Адрес 

Рейтинг 

Процент 




После прочтения ТЗ большая просьба оценить срок и стоимость разработки заполнив форму : https://forms.gle/m8FnKAquhnu2ksYg6







Алгоритм парсинга : 


Открываем таблицу : https://docs.google.com/spreadsheets/d/1NNMMm6w4FqCsWWK79pKbN1DnODru-XDy5iYgzvbGto8/edit?usp=sharing


  1. Берем из нее список категорий и суб категорий 

  2. Переходим на страничку суб категории 

  3. Переходим на страницу товара 

  4. Переходим на страницу продавца 

  5. Забираем там все остальные параметры 






Переходим на страничку магазина : 

image



Где взять параметры : 

Параметр название магазина 


image


Параметры : 

дата 

адрес 

рейтинг 

процент image





  1. ставка отозвана