Технічне завдання на розробку парсера (скрапера) Amazon
Завдання: Необхідно розробити надійний і відмовостійкий скрапер для отримання інформації з Amazon по великій кількості товарів (мільйони ASIN). Скрапер повинен стабільно працювати в режимі 24/7 і мінімізувати виникнення помилок HTTP 503 (блокування або обмеження доступу).
Обов'язкові вимоги:
Парсинг даних:
- Отримання інформації по товарам: назва, ціна, рейтинг, кількість відгуків, наявність на складі, опис товару, зображення та іншу інформацію зі сторінки товару по заданому списку ASIN.
- Підтримка великого обсягу запитів (від 100,000 до кількох мільйонів товарів).
Стабільність і масштабованість:
- Система повинна працювати цілодобово (24/7), без регулярних зупинок і необхідності ручного перезапуску.
- Передбачити механізми балансування запитів, використання проксі-серверів, зміни IP-адрес, а також механізмів затримки запитів для мінімізації ризику блокувань і помилок HTTP 503.
Обхід захисту і обмежень Amazon:
- Передбачити методи обходу антибот-захисту Amazon (CAPTCHA, блокування по IP, обмеження по User-Agent тощо).
- Використання механізмів автоматичного розпізнавання і вирішення CAPTCHA (наприклад, за допомогою сервісів антикапчі).
Управління проксі:
- Система повинна інтегрувати використання проксі-серверів з можливістю автоматичної ротації і моніторингу їх працездатності.
- Налаштувати моніторинг якості проксі, виключення заблокованих і повільних IP.
Управління помилками і логування:
- Реалізувати логування всіх дій скрапера: успішні запити, помилки, блокування і час відповіді.
- Реалізувати систему автоматичного повтору запитів у разі помилок, з налаштовуваною кількістю повторів і інтервалом між ними.
Формат і зберігання даних:
- Можливість вивантаження даних у зручні формати (CSV, JSON, бази даних).
- Реалізація швидкої і ефективної структури зберігання отриманих даних.
Інтерфейс управління (опціонально):
- Можливість зручного управління завданнями, перегляду статистики і стану роботи скрапера через веб-інтерфейс або API.
Вимоги до виконавця:
- Досвід роботи з веб-скрапінгом з Amazon.
- Знання технологій і інструментів обходу захисту (proxy, антикапча).
- Досвід роботи з великими обсягами даних і асинхронними запитами.
Очікуваний результат: Робочий, стабільний і масштабований інструмент, здатний цілодобово виконувати завдання по парсингу великої кількості даних з Amazon, мінімізуючи ймовірність блокувань і помилок.
-
А вот самого главного и не написали. Вы пишите миллион товаров. Это за какой период времени? Разово? Видимо проект не ваш лично...
-
от 100,000 до нескольких миллионов товаров в ЧАС
-
Актуальні фриланс-проєкти в категорії C та C++
Чорна Україна (RP-проект на базі MTA)
51 525 UAH
|
Інженер інфраструктури резидентних проксіМи будуємо мережу резидентних проксі з нуля — повністю власну, без сторонніх постачальників. Нам потрібен один винятковий мережевий інженер, щоб побудувати всю технічну основу. Що ви будете будувати: - Android фоновий SDK, який маршрутизує проксі-трафік через пристрої… C та C++, DevOps ∙ 4 дні 12 годин тому ∙ 13 ставок |
Добробка в існуючій версії 1с роздріб блоку для РЦ(розподільчого центру))в загальному поясню що у нас за база - Є загальний сервер де є дів база РОзница (де ставляться усі приходи) - база УТП- куди переливаються усі продажі - рахується націнка залишки по складах - маленькі бази роздрібних магазинів. по обмінам у нас Магазини обмінюються із базою… C та C++, C# ∙ 5 днів 3 години тому ∙ 6 ставок |
ПО Мастер-програма «KONSTRUCTOR»
185 490 UAH
Ми шукаємо дуже досвідченого C++ розробника для модернізації існуючого ПЗ (майстер-програми). Програма відповідає за створення виробного ПЗ, що представляє аудіо-візуальні сеанси психологічної корекції. Поточна версія написана на чистому WinAPI (Visual Studio 2019/2022).… C та C++, Десктопні додатки ∙ 10 днів 6 годин тому ∙ 19 ставок |
Написання коду для ArduinoПотрібно розробити програмне забезпечення для вагового дозатора на базі Arduino Uno. Комплектуючі: Arduino Uno R3 HX711 + тензодатчик LCD1602 I2C дисплей MAX7219 світлодіодна матриця 8x32 5 кнопок керування 4-канальне реле 2 сигнальні лампи Вібромагніт грубого дозування… C та C++, Вбудовані системи та мікроконтролери ∙ 11 днів 15 годин тому ∙ 15 ставок |