Парсинг сайта conrad.pl в xml по расписанию
6000 UAHНужен регуллярный парсинг с расписанием, перевод не нужен и форматирование тоже не надо это уже сделает другой человек
Парсить нужно Название, фотографии, Цена без скидки и со скидкой, наличие, код товара, описание и характеристики
парсить нужно каждую группу отдельно по ссылке
вот например
https://www.conrad.pl/pl/search.html?categoryId=c40078&tfo_flags=priceReducedProduct&tfr_price=20~~~8300&refresh=true
тут уже выбранна категория и выбранны нужные фильтра, нужна парсить все карточки товаров со всех страниц
таких ссылок будет примерно 12 сколько и главных группп, но нужен еще фильтр для подгрупп так не все подгруппы нужно парсить а только некоторые ну или можно без фильтра просто указывать больше ссылок только те подгруппы что нужны

Сервер использую https://hyperhost.ua/ для этого проекта арендую отдельный, настройка ваша нужна.
Это небольшая торговая площадка там более 1 мил. товаров. С фильтрами подгруп будет выходить до 200 тыс
1. Категорий главных всего 12, значит ссылок для парсинга будет 12

Вот для примера первая группа ссылка
https://www.conrad.pl/pl/search.html?categoryId=t01&tfr_price=0.112~~~141218.7&tfo_flags=priceReducedProduct&tfo_availabilityColor=green
В ссылке уже указаны нужные мне фильтры Цена, Новые продукты и акции, Доступность
Но нужно парсить не все подруппы а только избранные
2. Фото нужно только ссылки на них с сайта
3. Описание с html разметкой
Все данные которые надо парсить


4. Парсить желательно 1 раз в день или хотя бы в 2 дня, тут наверное было бы хорошо сделать так
если товар ранее был спарсен ранее то просто обновить цену, скидку, количество
а если товар новый то парсим все данные.Выдает в результате только 2000 товаров а многие подгруппы имеют намного больше товаров, поэтому тут надо как то обойти эти ограничения или наверное надо проваливатся глубже в группу уровня 3 или 4 чтобы или возможно вы сумеете обойти это
САЙТ ПОД ЗАЩИТОЙ ClodFlare
Парсер должен устанавливаться на VPN сервере и запускаться автоматически по расписанию планировщиком CRON
Результат работы - несколько файлов YML(XML) в формате ПРОМ - описание формата тут
Отзыв заказчика о сотрудничестве с Артемом Плахой
Парсинг сайта conrad.pl в xml по расписаниюРекомендую до сотрудничества )
Отзыв фрилансера о сотрудничестве с Дмитрием Ченковым
Парсинг сайта conrad.pl в xml по расписаниюВпервые работаем с господином Дмитрием, все довольны. Спасибо за четко поставленную задачу, свободное общение и щедрые чаевые
Актуальные фриланс-проекты в категории Java
Создание приложенияЖелаю создать мобильное приложение для общения, в приложении должны быть аудио, видео звонок, создание групповых чатов, возможность синхронизировать с контактами телефона, настройками аккаунта: привязка по email, 2fa, номеру телефона, возможность настраивать уведомления… Java, Python ∙ 3 дня 1 час назад ∙ 36 ставок |