Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!

Парсинг каталога hubbell

истекло время актуальности


Необходимо сделать парсинг каталога товаров: http://www.hubbell.com/Products/BoxesandFittings.aspx

ОПИСАНИЕ ФОРМАТА XLS

  1. categories - заполняет наш админ (ID рубрики) колонка 1 A
  2. donor_category (папка или категория). Рубрики должны идти через разделитель ">" напр. Шкафы, щиты и системы внутреннего распределения>Щиты для модульного оборудования>Щитки Nedbox Накладные распределительные щитки - от 8 до 48 модулей колонка 2 B
  3. donor_url Ссылка на страницу-оригинал колонка 3 C
  4. vendor Производитель колонка 4 D
  5. sku артикул колонка 5 E
  6. name - формируется таким образом - название товара из сайта донора, имя вендора (например, - Автоматичний вимикач, S801S-B8 , ABB) колонка 6 F
  7. image- ссылка на фото товара колонка 7G
  8. image_gallery - если несколько картинок, то заполняется в формате img1;img2;img3, картинка, которая указана в поле image в этом списке должна отсутствовать колонка 8 H
  9. price ( если указана на сайте) колонка 9 I
  10. measure колонка 10 J единица измерения или шт
  11. attributes -Атрибуты (или Характеристики) колонка 11 K. Все характеристики должны быть в одном поле. напр. Полное наименование: NUM - O 2х1,5 - 0,66::Количество жил: 2::Расцветка провода: гол.,бел.::Напряжение, В: 660::Тара: основная тара: бухта::Ед. измерения: м.::Температура эксплуатации: от -40 до +50::Температура монтажа: до -15 С::Сечение жилы, мм2: 1.5::Конструкция жилы: однопроволочная::Форма жилы: круглая::Наличие экрана: нет::Минимальный радиус изгиба: 10 наружных диаметров::Масса 1 км изделия, кг: 100.7::Основание для производства: ТУ 3521-001-12350648-2007::Номер сертификата соответствия: RU C-RU.АЮ64.В.01107::Номер сертификата ПБ: C-RU.ПБ05.В.00619::Длина бухты: 0.1
    разделитель между атрибутами - :: (два двоеточия)разделитель между атрибутом и значением - :пробел (двоеточие и один пробел после двоеточия)

  12. description -в колонку 12 L (описание) -

из атрибутов формируем таблицу вида

<table>

<tbody>

<tr>

<td>Атрибут1</td><td>Значение атрибута1</td>

<td>Атрибут2</td><td>Значение атрибута2</td>

...................................

</tr>

</tbody>

</table>

если на странице товара есть еще какой-то текст, то грабим его вместе с тегами и вставляем ниже под таблицей с атрибутами, и это все будет поле descr


  1. currency_name - UAH, USD или EUR согласно валюте, в которой указана цена на сайте донора колонка 13 M
    14. additional_materials- для доп. материалов (если есть) колонка 14 N (ссылки грабить вместе с дополнительными материалами ,а не просто ссылку)
    15. certificates- если сертификаты есть на сайте колонка 15 O (ссылки грабить вместе с названием сертификата ,а не просто ссылку)

ВОПРОСЫ
1.Сколько товаров реально спарсить здесь?

2 Какая Ваша стоимость?

3. Срок выполнения ?
4. Какая стоимость спарсить картинки архивным файлом и срок выполнения?
Благодарю за обратную связь!

Сделать ставку!

Заказчик не желает делать предоплату? Предложите оплату через Сейф, чтобы избежать возможного мошенничества.
  1.  фрилансер больше не работает на сервисе

Заказчик
Проект опубликован
6 ноября 2015
166 просмотров
Способы оплаты
Метки
Поделиться