Упрощенная служба скрапинга на основе API
Здравствуйте,
Я ищу **оптимизированный сервис для скрапинга на основе API** для sahibinden.com — специально адаптированный под отфильтрованный URL, который я предоставлю. Этот сервис должен быть эффективным, устойчивым к защитам Cloudflare и возвращать чистые JSON-ответы.
**Объем работы:**
- Использовать предоставленный отфильтрованный URL (например, недвижимость или транспортные средства) в качестве конечной точки ввода.
- Скрапить оба:
• **Страница объявления**: заголовок, URL, краткое описание.
• **Страница деталей**: информация о пользователе, цена, дата объявления, URL изображений и категория (например, "недвижимость", "транспортное средство" или "другое").
- Возвращать хорошо структурированный **JSON-вывод**.
**Ключевые технические требования:**
- Выставлен как **HTTP API сервис** — клиент делает HTTP-запрос с URL и получает JSON в ответ.
- Должен быть устойчивым к мерам защиты Cloudflare от ботов, в частности, корректно обрабатывать ошибки 429 Слишком много запросов.
- **Опциональная поддержка прокси** (сервис может использовать или не использовать прокси в зависимости от конфигурации).
- Должен включать стратегию обхода или смягчения капчи (например, API для решения CAPTCHA или мягкое управление ошибками).
- Надежное управление сессиями (куки, заголовки и т.д.), ограничение частоты, экспоненциальное увеличение времени ожидания, логика повторных попыток и ведение журналов.
**Результаты:**
1. **MVP Доказательство концепции**: Рабочий пример для предоставленного URL (код + краткое демонстрационное видео).
2. **Сервис, готовый к производству**: Docker-приложение, README, описывающее использование API, формат запросов/ответов, параметры и примеры.
3. **Поддержка**: Гарантия незначительных обновлений (например, изменения структуры HTML) в течение первых 30 дней после доставки.
**Сроки:** Пожалуйста, предложите свои сроки (например, 1 неделя для MVP, еще неделя для финализации).
**Желаемые навыки и опыт:**
- Веб-скрапинг и автоматизация с использованием **Playwright** или **Puppeteer**.
- Практический опыт с **обходом Cloudflare и стратегиями против ботов**.
- Конфигурация прокси и логика обхода.
- Опционально: методы решения CAPTCHA.
- Разработка API-сервисов с четкой документацией.
**Как подать заявку:**
- Поделитесь предыдущими примерами PoC или проектов (желательно с JSON-выводами).
- Предоставьте краткое техническое объяснение вашего подхода.
- Включите пример использования API и возвращаемую структуру JSON.
С нетерпением жду возможности поработать с вдумчивым, ориентированным на детали разработчиком!
-
2 дня11 231 UAH
267 2 дня11 231 UAHПривет! Я создам оптимизированный сервис HTTP-скрапинга для sahibinden.com, адаптированный к вашему отфильтрованному URL. Он будет устойчив к Cloudflare и возвращать чистый JSON.
-
1 день44 923 UAH
96620 1276 1 10 1 день44 923 UAHЗдравствуйте. У меня есть опыт работы с Puppeteer. Я готов к сотрудничеству.
-
14 дней22 461 UAH
3305 70 1 14 дней22 461 UAHЗдравствуйте,
Я готов обсудить ваш проект. У меня есть обширный опыт работы с Puppeteer, а также опыт создания API для управления приложениями, планирования задач и получения результатов выполнения.
Ориентировочный срок: 1 неделя на прототип и еще 1 неделя на доработку.
-
14 дней15 723 UAH
5149 210 0 14 дней15 723 UAHЗдравствуйте,
Я готов обсудить ваш проект. У меня есть обширный опыт работы с Puppeteer, а также опыт создания API для управления приложениями, планирования задач и получения результатов выполнения.
Ориентировочный срок: 1 неделя на прототип и еще 1 неделя на доработку.
Актуальные фриланс-проекты в категории Парсинг данных
Собрать базу и добавить в телеграм чатСобрать базу из Лист юа и добавить по номерам в телеграм чат. Чат на тему ремонта и дизайна интерьера. Парсинг данных, Работа с клиентами ∙ 12 часов 20 минут назад ∙ 19 ставок |
Необходимо разработать Telegram-бота для мониторинга автомобилей с аукционов США (Copart, IAAI)Необходимо создать Telegram-бота для автоматического поиска и мониторинга автомобилей "BUY IT NOW" на аукционах США (Copart, IAAI). Бот должен работать в автоматическом режиме и отправлять сообщения о новых автомобилях, которые соответствуют заданным фильтрам.Основной… Парсинг данных, Разработка ботов ∙ 19 часов 53 минуты назад ∙ 69 ставок |
Парсинг товаров, подготовка к импорту на WPСпарсить полный каталог этих сайтов: https://svit-mebliv.ua/ https://kompanit.com.ua/ru https://amia.com.ua/ https://mebliromax.com.ua/ https://pehotin.com.ua/catalog/ https://www.sokme.ua/ru/ Все товары нужно объединить в одну обющую таблицу для импорта в WP. Каждый товар… Веб-программирование, Парсинг данных ∙ 3 дня 12 часов назад ∙ 57 ставок |
Требуется специалист по продвижению в Telegram.
1273 UAH
Задачи: инвайт реальных пользователей по базе юзернеймов в новые чаты и рассылка сообщений по целевой базе. Интересует только качественный трафик и работа с живой аудиторией — исполнителей, использующих ботов, накрутку или некачественные методы, просьба НЕ БЕСПОКОИТЬ. Работа… Парсинг данных, Продвижение в социальных сетях (SMM) ∙ 8 дней 12 часов назад ∙ 9 ставок |
Консультация по парсингу подписчиков Instagram-аккаунтовЗдравствуйте. Необходимо провести предварительную оценку возможности выполнения следующей задачи. У меня есть список Instagram-аккаунтов. Цель — получить контактные данные (в первую очередь email-адреса) пользователей, которые подписаны на эти аккаунты. Ранее мне встречались… Парсинг данных ∙ 12 дней 7 часов назад ∙ 13 ставок |