Онлайн парсер
Онлайн парсер разделов "To Do" и "Holiday Rentals" с сайта
http://www.tripadvisor.com/
Заполнять нашу базу конечными объектами. А именно:
- карточки To Do
- карточка Holiday Rentals
1. Парсеры должны быть:
а) автономны, взаимонензависимы
б) запускаться по расписанию cron (выполняться в shell-среде)
в) использовать для закачки внешний текстовый файл со списком прокси
г) закачивать всю информацию через прокси-сервера
д) при успешном сканировании парсер должен оставлять метку в таблице скул
Ссылка на источник картинки
Ссылка на выкачаную страницу-источник
2. Все ревьюзы должны иметь (если заполнено поле):
а) str Наименование (шапка)
б) array Поставленные оценки (Value, Atmosphere, Service, Food)
в) date дата отзыва
г) text текст отзыва
д) str логин пользователя
е) str аватар пользователя
ж) str город пользователя
е) str страна пользователя
3. Все картинки, которые закачиваются на сервер, должны:
а) переименованы согласно правилу переименования.
Новое имя – наименование объекта, к которому картинка относится + локация уровнем выше,
разделенная подчеркиваниями + Если картинка - лого, то_ logo, если аватар, то _avatar,
если фото, то _foto_[01, 02 итд],
Пример: [06_central_hostel]_[buenos_aires]_[argentina]_logo.jpg
Пример: [06_central_hostel]_[buenos_aires]_[argentina]_01.jpg
б) Все имена объектов должны быть переименованы, согласно правилам переименования.
в) Имена локаций должны оставаться неизменными, иерархия сохраняться.
Пример: [06_central_hostel]_[buenos_aires]_[argentina]_logo.jpg
должен лежать по пути /img/to-d/argentina/buenos_aires/06_central_hostel_logo.jpg
Правила переименования:
В наименовании должно остаться только буквы, цифры, тире, апостроф, скобки ().
Символы +, & и подобные заменять на plus, and, итд. Если попадается что-то не описаное в требованиях – уточняем.
Необходимые поля:
Развлечения:
str наименование,
str адрес,
str телефон,
str сайт,
array Тип (Type),
str Описание (owners description),
str е-маил,
array путь (breadcrumbs),
array Профессиональные фотографии (Professional photos),
array Фотографии посетителей (Visitor photos),
array рейтинг (Excellent, Very good, Average, Poor, Terrible),
array отзывы (1я страница <= 10 отзывов),
array координаты с карты google
Квартиры в аренду (Holiday rentals):
str наименование,
str адрес,
str телефон,
str сайт,
array удобства (amenities and details),
str описание (Property details),
str е-маил,
array путь (breadcrumbs),
array Фотографии (Professional photos),
array Фотографии посетителей (Visitor photos),
float рейтинг (4.5 of 5 stars), если есть
array рейтинг (Excellent, Very good, Average, Poor, Terrible),
array отзывы (1я страница <= 10 отзывов),
array координаты с карты google,
str цены (rates),
str платежи (fees)
Верхний уровень локации (London):
str наименование,
str Описание (owners description),
array путь (breadcrumbs),
array Профессиональные фотографии (Professional photos),
array Фотографии посетителей (Visitor photos),
array рейтинг (Excellent, Very good, Average, Poor, Terrible),
array отзывы (1я страница <= 10 отзывов),
array координаты с карты google
если попадается локация speciality lodging, закрепляем объект,
находящийся в этой локации, за локацией-родителем локации,
содержащей speciality lodging.
Например "South America > Argentina > Capital Federal
District > Buenos Aires > Buenos Aires Specialty Lodging"
закрепляем за "South America > Argentina > Capital Federal
District > Buenos Aires"
Для ускорения выполнения работы предоставляем списки прокси,
механизм закачки через прокси, класс преобразования кода html
в объект dom
-
5 днів17 970 UAH
143 5 днів17 970 UAHДобрый день.
Имею опыт в парсинге открытых данных поисковой выдачи от туроператоров, а так же ресурсов подобных booking.com. По опыту знаю что трудозатраты могут сильно возрасти если разработчики защитились от подобных ботов. И прокси далеко не всегда спасают.
Предложенная ставка отображает лишь решение поставленной задачи, без обхода защиты (предполагается что списка прокси будет достаточно).
Подробности необходимо обсуждать
skype: klerik3d
email: [email protected]
Актуальні фриланс-проєкти в категорії Веб-програмування
Спеціаліст з n8n для налаштування автоматизації + навчання (коучинг-формат)Шукаю досвідченого спеціаліста з n8n та AI (LLM API) для налаштування автоматизації рекрутингу. Головна умова: робота у форматі коучингу / менторства. Мені потрібна не «чорна скринька», а навчання: ми зідзвонюємося, ви пояснюєте логіку — я налаштовую все своїми руками під вашим… AI та машинне навчання, Веб-програмування ∙ 7 годин 21 хвилина тому ∙ 7 ставок |
Створення сайтів, блокчейн розробники
12 959 UAH
Створення сайту повного із оплатою та всім сучасним функціоналом. Сайт із моєю діяльністю перед післяпродажне прибирання території, рубання дров, інші роботи по господарству Веб-програмування, Розробка ботів ∙ 7 годин 51 хвилина тому ∙ 30 ставок |
Налаштування автоматизації: Форма на сайті → WhatsApp-бот → CRM (Make + WATI)Опис проекту: Є сайт компанії з перевезень. Клієнти залишають заявку через форму на сайті — форма приходить на email. Потрібно налаштувати наступну автоматизацію:Етап 1 — Форма → WhatsApp — Коли на пошту приходить нова заявка з сайту, система автоматично витягує ім'я та номер… Веб-програмування, Розробка ботів ∙ 1 день 9 годин тому ∙ 38 ставок |
Хочу навчитись створювати сайти по Ксго/Кс2Потрібен ментор, який навчить мене створити CS2/CS:GO сервер. Хочу через Discord/Zoom покроково розібрати: хостинг/VPS, server.cfg, карти, плагіни, адмінку, бан-систему, Discord, сайт і статистику. Мова: українська або російська. HTML та CSS верстання, Веб-програмування ∙ 1 день 15 годин тому ∙ 13 ставок |
Шукаю програміста або вайб-кодера для автоматизації збору даних 2https://drive.google.com/file/d/14tP5XWJB9acV4gn_cJrFwMpihUj3EbQz/view?usp=sharing я випадково на ту ссылку послав Веб-програмування, Парсинг даних ∙ 1 день 18 годин тому ∙ 33 ставки |