Парсинг данных с сайта
22 USDПример страницы объекта
http://global.remax.com/House-For-Sale-Margate-Margate_1031298002-25
Необходимо спарсить:
1. Все фото оьбъекта из слайдера, пометив то, котрое является фото по умолчанию. В том случае если на странице объекта присутствуют и другие фото (помимо фото в слайдере) необходимо спарсить и их.
В слайдере присутствуют фото с вотермарками на некоторых объектах. Например как на объекте
http://global.remax.com/Condo-Apartment-For-Sale-Kagithane-Istanbul-Avrupa_4129012-61
Для подобных случаев необходимо найти на таких страницах и спарсить фото без вотермарков. Если пути к фото без вотермарков доступны.
2. Название, выделенное тегом <h2>
3. Цену в национальной валюте (она под названием, выделена красным цветом)
А так же в других валютах (если они присутствуют).
3. Адрес (находится под ценой, выделен серым цветом)
4. ID
5. Необходимо спарсить параметры и их значения, находящиеся в блоке <div class="attributes-data"></div>
6. Основное описание. В странице примера оно начинается словами "One of a kind home positioned in Margate…"
http://global.remax.com/House-For-Sale-Margate-Margate_1031298002-25
7. Спарсить список параметров, находящихся в блоке <div class="features-container"></div>
8. На странице объекта есть идентичные по стилю блоки имеющие название в теге <h4>. К ним относятся
<div class="features-container"></div>
<div class="listfull-rooms"></div>
Со своим содержимым
На странице примера они имеют названия соответственно Features и Rooms
На разных страницах объектов может быть и другие подобные блоки, которых нет в странице примера. И названия классов у них могут отличаться. Необходимо спарсить их со своми содержимым.
При парсинге содержимого необходимо разделять название параметра и его значение
9. Спарсить текст в <div id="disclaimer"></div>
10. Спарсить все данные в блоке «MANAGING AGENT». Включая фото агента, его контактные данные, ссылку на страницу с полным описанием агента и прочую информацию находящуюся в этом блоке. Для тех случаев, когда нет фото агента необходимо делать пометку в результатах парсинга «Нет фото»
Результат парсинга необходимо предоставить в виде таблицы MySQL. И отдельно файлы изображений в тех форматах в которых они находятся на сайте.
Так же спарсить название языка по умолчанию (на странице примера это English), так же должны быть спарсены все единицы измерения и географические координаты (в формате широта / долгота).
Примечание 1: единицы измерения должны быть локализированы для каждой страны (например km, км, miles, мили, и т. д.)
Примечание 2: результаты парсинга должны содержать ссылку на страницу объекта (это делается для каждого объекта недвижимости).
Примечание 3: если объект помечен как «The Remax Collection», например как
http://global.remax.com/119431004-31
то нужно проставлять соответствующий флаг в результирующей таблице, содержащей результаты парсинга. Т.е. должна быть предусмотрена соответствующая колонка.
-
967 57 0 Здравствуйте, буду рад вам помочь с исполнением Вашего задания.
Могу вас заверить что работа будет сделана быстро и качественно,
что доказано хорошим рейтингом сдесь на бирже.
Отпишите, готов сотрудничать.
-
441 16 0 Добрый день.
Сделаю в точности по ТЗ.
Срок указан максимальный.
-
1321 67 0 Сделаю
-
2748 153 0 1 Здравствуйте. Готов сделать.
-
добрый день! Это окончательный бюджет?
-
Current freelance projects in the category Data Parsing
Consultation on parsing Instagram account subscribersHello. It is necessary to conduct a preliminary assessment of the feasibility of the following task. I have a list of Instagram accounts. The goal is to obtain contact information (primarily email addresses) of users who follow these accounts. Previously, I encountered companies… Data Parsing ∙ 2 days 1 hour back ∙ 12 proposals |
A specialist is needed to find contacts of decision-makers in Ukraine.It is necessary to gather a database (or ready database) of contacts of decision-makers (DMs) in companies in Ukraine. Information Gathering, Data Parsing ∙ 2 days 5 hours back ∙ 16 proposals |
Need to scrape data from LinkedInWe need to scrape data from LinkedIn based on our list. For each entry, we need to find and collect available data if it exists on the LinkedIn profile, including the profile picture on the LinkedIn social network, email address, links to social media, company website, and… Data Parsing ∙ 2 days 11 hours back ∙ 27 proposals |
Parsing and classification of dataWe are looking for a developer to implement a system for collecting and structuring data from open sources. We have a database of small business owners in the USA, which contains the person's name, company name, address, and state. It is necessary to build a process for… Web Programming, Data Parsing ∙ 2 days 12 hours back ∙ 41 proposals |
Svitlahata
17 USD
It is necessary to import 1819 products from the XML/YML feed of Prom.ua to OpenCart 3. A ready XML file is available, which contains product names, descriptions, prices, photos, specifications, manufacturers, and categories. Requirements: import all products to OpenCart… Content Management Systems, Data Parsing ∙ 3 days 15 hours back ∙ 34 proposals |