Упрощенная служба скрапинга на основе API
Здравствуйте,
Я ищу **оптимизированный сервис для скрапинга на основе API** для sahibinden.com — специально адаптированный под отфильтрованный URL, который я предоставлю. Этот сервис должен быть эффективным, устойчивым к защитам Cloudflare и возвращать чистые JSON-ответы.
**Объем работы:**
- Использовать предоставленный отфильтрованный URL (например, недвижимость или транспортные средства) в качестве конечной точки ввода.
- Скрапить оба:
• **Страница объявления**: заголовок, URL, краткое описание.
• **Страница деталей**: информация о пользователе, цена, дата объявления, URL изображений и категория (например, "недвижимость", "транспортное средство" или "другое").
- Возвращать хорошо структурированный **JSON-вывод**.
**Ключевые технические требования:**
- Выставлен как **HTTP API сервис** — клиент делает HTTP-запрос с URL и получает JSON в ответ.
- Должен быть устойчивым к мерам защиты Cloudflare от ботов, в частности, корректно обрабатывать ошибки 429 Слишком много запросов.
- **Опциональная поддержка прокси** (сервис может использовать или не использовать прокси в зависимости от конфигурации).
- Должен включать стратегию обхода или смягчения капчи (например, API для решения CAPTCHA или мягкое управление ошибками).
- Надежное управление сессиями (куки, заголовки и т.д.), ограничение частоты, экспоненциальное увеличение времени ожидания, логика повторных попыток и ведение журналов.
**Результаты:**
1. **MVP Доказательство концепции**: Рабочий пример для предоставленного URL (код + краткое демонстрационное видео).
2. **Сервис, готовый к производству**: Docker-приложение, README, описывающее использование API, формат запросов/ответов, параметры и примеры.
3. **Поддержка**: Гарантия незначительных обновлений (например, изменения структуры HTML) в течение первых 30 дней после доставки.
**Сроки:** Пожалуйста, предложите свои сроки (например, 1 неделя для MVP, еще неделя для финализации).
**Желаемые навыки и опыт:**
- Веб-скрапинг и автоматизация с использованием **Playwright** или **Puppeteer**.
- Практический опыт с **обходом Cloudflare и стратегиями против ботов**.
- Конфигурация прокси и логика обхода.
- Опционально: методы решения CAPTCHA.
- Разработка API-сервисов с четкой документацией.
**Как подать заявку:**
- Поделитесь предыдущими примерами PoC или проектов (желательно с JSON-выводами).
- Предоставьте краткое техническое объяснение вашего подхода.
- Включите пример использования API и возвращаемую структуру JSON.
С нетерпением жду возможности поработать с вдумчивым, ориентированным на детали разработчиком!
-
2 дня11 085 UAH
267 2 дня11 085 UAHПривет! Я создам оптимизированный сервис HTTP-скрапинга для sahibinden.com, адаптированный к вашему отфильтрованному URL. Он будет устойчив к Cloudflare и возвращать чистый JSON.
-
1 день44 340 UAH
93908 1263 1 10 1 день44 340 UAHЗдравствуйте. У меня есть опыт работы с Puppeteer. Я готов к сотрудничеству.
-
14 дней22 170 UAH
3336 70 1 14 дней22 170 UAHЗдравствуйте,
Я готов обсудить ваш проект. У меня есть обширный опыт работы с Puppeteer, а также опыт создания API для управления приложениями, планирования задач и получения результатов выполнения.
Ориентировочный срок: 1 неделя на прототип и еще 1 неделя на доработку.
-
14 дней15 519 UAH
5195 210 0 14 дней15 519 UAHЗдравствуйте,
Я готов обсудить ваш проект. У меня есть обширный опыт работы с Puppeteer, а также опыт создания API для управления приложениями, планирования задач и получения результатов выполнения.
Ориентировочный срок: 1 неделя на прототип и еще 1 неделя на доработку.
Актуальные фриланс-проекты в категории Парсинг данных
Парсинг товара для промЗдравствуйте, нужно парсинг сайта (не сложного), количество товара тоже не большое. По срокам желательно не растягивать на месяц Парсинг данных ∙ 32 минуты назад ∙ 22 ставки |
Нужен парсер интернет-магазина https://www.lcsc.com/нужно регулярно (1 раз в месяц, или по запуску скрипта) получать актуальную информацию о товарах в наличии магазина https://www.lcsc.com/ из каталога всех разделов… Парсинг данных ∙ 3 часа 6 минут назад ∙ 26 ставок |
OpenCart — каталог аренды спецтехники
6000 UAH
OpenCart — каталог аренды спецтехникиНеобходимо запустить каталог аренды спецтехники на OpenCart.Тематика:экскаваторыавтовышкипогрузчикигенераторыкраныстроительные лесадругая строительная техника.Желательно, чтобы у вас уже был готовый шаблон или наработки под спецтехнику,… Веб-программирование, Парсинг данных ∙ 19 часов 32 минуты назад ∙ 46 ставок |
Перенести программу - слетел сервер, где была программа (официальный разрешенный парсинг гос данных)
2066 UAH
Добрый! У меня у клиента произошел данный кейс описанный ниже. Нужно помочь перенести на новый сервер и оттестировать программу. Лучше программист, который разбирается в парсинге. Настройка ПО и серверов, Парсинг данных ∙ 23 часа 25 минут назад ∙ 26 ставок |
Парсинг и классификация большого массива изображенийНеобходимо реализовать проект по сбору и структурированию большого массива архитектурных изображений из открытых веб-источников.Задача включает: автоматизированный сбор изображений; загрузка файлов в максимально доступном качестве; классификацию изображений по категориям:… Python, Парсинг данных ∙ 23 часа 53 минуты назад ∙ 30 ставок |