Техническое задание на разработку парсера (скрапера) Amazon
Задача: Необходимо разработать надежный и отказоустойчивый скрапер для получения информации с Amazon по большому количеству товаров (миллионы ASIN). Скрапер должен стабильно работать в режиме 24/7 и минимизировать возникновение ошибок HTTP 503 (блокировка или ограничение доступа).
Обязательные требования:
Парсинг данных:
- Получение информации по товарам: название, цена, рейтинг, количество отзывов, наличие на складе, описание товара, изображения и другую информацию со страницы товара по заданному списку ASIN.
- Поддержка большого объема запросов (от 100,000 до нескольких миллионов товаров).
Стабильность и масштабируемость:
- Система должна работать круглосуточно (24/7), без регулярных остановок и необходимости ручного перезапуска.
- Предусмотреть механизмы балансировки запросов, использование прокси-серверов, смены IP-адресов, а также механизмов задержки запросов для минимизации риска блокировок и ошибок HTTP 503.
Обход защиты и ограничений Amazon:
- Предусмотреть методы обхода антибот-защиты Amazon (CAPTCHA, блокировка по IP, ограничения по User-Agent и пр.).
- Использование механизмов автоматического распознавания и решения CAPTCHA (например, с помощью сервисов антикапчи).
Управление прокси:
- Система должна интегрировать использование прокси-серверов с возможностью автоматической ротации и мониторинга их работоспособности.
- Настроить мониторинг качества прокси, исключение заблокированных и медленных IP.
Управление ошибками и логирование:
- Реализовать логирование всех действий скрапера: успешные запросы, ошибки, блокировки и время ответа.
- Реализовать систему автоматического повтора запросов в случае ошибок, с настраиваемым количеством повторов и интервалом между ними.
Формат и хранение данных:
- Возможность выгрузки данных в удобные форматы (CSV, JSON, базы данных).
- Реализация быстрой и эффективной структуры хранения полученных данных.
Интерфейс управления (опционально):
- Возможность удобного управления задачами, просмотра статистики и состояния работы скрапера через веб-интерфейс или API.
Требования к исполнителю:
- Опыт работы с веб-скрапингом с Amazon.
- Знание технологий и инструментов обхода защиты (proxy, антикапча).
- Опыт работы с большими объемами данных и асинхронными запросами.
Ожидаемый результат: Рабочий, стабильный и масштабируемый инструмент, способный круглосуточно выполнять задачи по парсингу большого количества данных с Amazon, минимизируя вероятность блокировок и ошибок.
-
А вот самого главного и не написали. Вы пишите миллион товаров. Это за какой период времени? Разово? Видимо проект не ваш лично...
-
от 100,000 до нескольких миллионов товаров в ЧАС
-
Актуальные фриланс-проекты в категории C и C++
Инженер по инфраструктуре резидентных проксиМы строим сеть резидентных прокси с нуля — полностью собственную, без сторонних поставщиков. Нам нужен один исключительный сетевой инженер для создания всей технической базы. Что вы будете строить: - Android SDK для фонового использования, который направляет прокси-трафик через… C и C++, DevOps ∙ 3 дня 6 часов назад ∙ 12 ставок |
Добробка в существующей версии 1с розница блока для РЦ(распределительного центра)В общем поясню, что у нас за база - есть общий сервер, где есть база Розница (где ставятся все приходы) - база УТП, куда переливаются все продажи - считается наценка, остатки по складам - маленькие базы розничных магазинов. По обменам у нас магазины обмениваются с базой Розница… C и C++, C# ∙ 3 дня 21 час назад ∙ 6 ставок |
ПО Мастер-программа «KONSTRUCTOR»
185 490 UAH
Мы ищем очень опытного C++ разработчика для модернизации существующего ПО (мастер-программы). Программа отвечает за создание производного ПО представляющего аудио-визуальные сеансы психологической коррекции. Текущая версия написана на чистом WinAPI (Visual Studio 2019/2022).… C и C++, Десктопные приложения ∙ 9 дней назад ∙ 19 ставок |
Написание кода для ArduinoНеобходимо разработать программное обеспечение для весового дозатора на базе Arduino Uno. Комплектующие: Arduino Uno R3 HX711 + тензодатчик LCD1602 I2C дисплей MAX7219 светодиодная матрица 8x32 5 кнопок управления 4-канальное реле 2 сигнальные лампы Вибромагнит грубого… C и C++, Встраиваемые системы и микроконтроллеры ∙ 10 дней 9 часов назад ∙ 15 ставок |
Нужно доработать проект или предоставить консультацию.
1000 UAH
|