Парсер с сайта Allegro.pl
Список требований к парсеру:
1. Парсер должен работать онлайн на сервере в связке с движком магазина. На каком движке Вы смогли бы реализовать такой парсер? Это может быть любая подходящая и хорошо знакомая Вам опенсорсная CMS.
2. Парсер должен парсить только раздел автозапчасти http://allegro.pl/czesci-samochodowe-620 . В разделе около 24 тысяч категорий и подкатегорий, которые должны формировать такую же древовидную структуру как на сайте доноре.
3. При парсинге должны копироваться такие данные из карточки товара, а именно: Заголовок, номер лота, фотографии, состояние (новый или б/у). Желательно чтобы сами фотографии не скачивались, а парсились только ссылки на изображения на сервере allegro.
4. Также должна парсится и цена товара +доставка "pobraniowa" с возможностью ее дальнейшей конвертации, Злотый - Гривна или $ и умножения на нужный коэффициент заданный в админке.
5.Так как все названия на сайте доноре на польском языке то желательно чтобы при парсинге названия товаров переводились с польского на русский.
С гугл переводчиком наверно ничего не получится из-за неоправданной дороговизны (17миллионов названий товаров, каждое из которых состоит из как минимум 15-20 символов, нетрудно подсчитать в какую сумму обойдётся перевод такого объёма текста) и корявым переводом. В разделе почти все слова, это названия запчастей которые повторяются тысячи раз, всего же в автомобиле 5-10 тысяч наименований запчастей которые нужно перевести, плюс некоторое количество общепринятых слов таких как левый, правый, задний, передний и т д. Возможно ли осуществлять перевод при помощи какого-то специализированного промышленного словаря или может даже составить его самостоятельно? Какие могут быть варианты реализации подобного переводчика?
6. Товары при парсинге должны попадать в «правильные» соответствующие им категории и подкатегории товаров.
7. Должна быть возможность запускать парсер в автоматическом режиме по расписанию, скажем один раз в сутки. При этом парсер должен по номеру лота проверять наличие на сайте донора.
8. Парсер должен иметь возможность работать через прокси или другие анонимайзеры, на случай если сайт донор будет вводить какие либо ограничения.
9. Парсер должен иметь такую же форму поиска как и в http://www.global-cars.com.ua (марка, модель, поисковое окно для названия детали)
То есть пользователь выбирает в выпадающем списке формы марку автомобиля, далее в другом окошке формы становится доступен список моделей для данной марки и пользователь выбрав ее и введя название требуемой детали осуществляет поиск.
Хотелось бы получить от вас развёрнутый ответ с комментариями по каждому из требований к парсеру из списка выше.
-
322 22 0 1 Готов сотрудничать пишите в Skype: casper6132 обсудим детали.
Актуальные фриланс-проекты в категории PHP
Ищу White-label решение Букмекерской конторы под аренду |
Разработка веб-сайта WordPress
1002 UAH
|
Сломалась корзина WooCommerce (WordPress) — не добавляет товар и не открывается страница корзиныНа сайте интернет-магазина https://www.dobryi-gospodar.com/ (WordPress + WooCommerce) полностью перестала работать функция оформления заказа. При нажатии на кнопку "Добавить в корзину" (как в карточке товара, так и в каталоге) начинается длительная загрузка (индикатор крутится),… CMS, PHP ∙ 2 дня 9 часов назад ∙ 60 ставок |
Функция поиска товаров по изображениюНеобходимо разработать и интегрировать на сайт функциюпоиска товаров по изображению.Что нужно реализоватьКнопка«Поиск по фото»на сайте.Загрузка изображения пользователем: JPG.Поиск визуально похожих товаров в каталоге.Вывод результатов в виде стандартных карточек товаров: фото,… PHP, Веб-программирование ∙ 2 дня 17 часов назад ∙ 45 ставок |
Парсер expireddomains.net
5000 UAH
Нужен парсер expireddomains.net на сайте нужно сначала залогиниться, проблема в том что блокирует ИП при попытке парсить данные, нужно парсить тематические домены по списку ключевых слов, кто не уверен в своих силах не пишите PHP, Веб-программирование ∙ 4 дня 16 часов назад ∙ 51 ставка |