Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!
8 000 ₽

Парсинг сайтов, редакция спарсенных материалов.

закрыт без выполнения


ребуется специалист готовый работать с большим объемом информации, человек которого не пугают объемы и монотонный, в том числе РУЧНОЙ труд.

- все ссылки на сайты-доноры для парсинга, откуда нужно брать фильтры предоставляются нами.

- парсинг происходит из самых различных сайтов, разнообразной тематики.

- 60 % парсинга происходит из яндекс-маркета.

- оплата производится в любой удобной для вас форме, поэтапно. Каждая категория (всего 30 категории различной тематики, например: "Спорт и туризм", "Красота и здоровье", "Промышленное") оплачивается в зависимости от ее объема (от 3000 до 5000 рублей).


Требуемые навыки:


- профессиональный парсинг;

- работа c Microsoft Exel;

- работа с объёмными информативными текстами;

- понимание импорта/экспорта файлов сайта;

- орфографическая и пунктуационная грамотность;

- внимательность, усидчивость, трудолюбие.


Описание задания:


Необходимо cпарсить и отредактировать информацию (фильтры) в полном соответствии с информацией сайтов-доноров, указанных во вкладке "url" (ссылки). Заполняются исключительно три (3) вкладки: "Feature name" (название фильтра), "Type" (типы фильтров) и "Variants" (варианты фильтров).


В ходе парсинга и редактирования необходимо, т.е.готовый файл должен полностью соответствовать следующим критериям:


1. Фильтры/характеристики должны ПОЛНОСТЬЮ ТОЧНО СООТВЕТСТВОВАТЬ указанной категории по тематике.


2. Проверить фильтры на ПОЛНОЕ совпадение с ссылками в соответствующей вкладке "url".


3. Убрать дублирующие фильтры: Необходимо объединять фильтры в случае дублирования в рамках одной главной категории и перечислить их через точку с запятой.


Пример:


Фильтр "Объем гб" в главной категории "Электроника" встретился в 3-х подкатегориях (телефоны, планшеты, компьютеры), подобные фильтры необходимо объединять в один фильтр с перечислением всех категории в которых он был, через точку с запятой.


4. Убрать фильтры связанные с ценой, количеством, наличием товара, скидками, акциями, магазинами, рейтингом магазинов, состоянием товара, доставкой, способом доставки, спецпредложениями и т.д.


(Требуется оставить исключительно характеризующие товар фильтры + бренд и производитель).


Пример: "цена", "стоимость", "розничные цены", "диапазон цен", "количество","в наличии" и т.д необходимо исключить.


5. Полностью очистить файл от лишних символов и слов не соответствующих фильтрам или тематике.


Пример: символы "?", "<!--


6. Присвоить тип фильтрам в полном соответствии с фильтрами из ссылок в соответствующей вкладке "url", но при этом, например фильтр "производитель" или фильтр "бренд" и др. во всех категориях должны быть одинакового типа.


Пример: фильтр "цвет" имеет тип "чекбокс - выборка", соответственно до конца задания, абсолютно во-всех категориях (ВЕЗДЕ) тип фильтра "цвет" будет - "чекбокс - выборка".


7. В Фильтрах диапазонного типа нужно указывать только название фильтра, варианты остаются пустые.


8. Все варианты во вкладке "Variants" (варианты фильтров) перечисляются через запятую, начинаются с большой буквы.


9. Отсутствие полных грамматических орфографических ошибок при заполнении.


Пример:  В фильтрах "Бренд" названия брендов должны полностью соответствовать их наименованию, ошибки исключаются.


10. Готовый формат Exel только в UTF-8 !!!!


Обозначение типов фильтров во вкладке "Type" (типы фильтров):


"Чекбокс одиночный" обозначается буквой - "C".

"Число вариантны" обозначается буквой - "N" (ограниченное число вариантов) выпадающий список (аналог радиобатон).

"Числовой диапазон" обозначается буквой - "O" (без вариантов).

"Бренд" обозначается буквой "E".

"Группа чекбоксов" обозначается буквой - "М" (множественный выбор).

"Текст без ограничений" обозначается буквой - "T" ( множественный выбор с возможностью добавления пользователем).


- Парсинг категории "Одежда и обувь"

- помещение спарсенных материалов в полном соответствии с ранее присланным файлом "результат парсинга"



  1.  9794 
       77  0

    14 дней8 000 ₽
    Misha Titkov проверен 



    Один месяц бесплатная гарантия на поддержку. Гарантии выполнения вашего тз в срок. Скорость имеет значение. MTitkov Telegram: (https://t.me/Zusykss) Сайт: http://smart-softs.com/

    Украина Днепр | 7 октября в 14:23 |