Парсер с сайта Allegro.pl
Список требований к парсеру:
1. Парсер должен работать онлайн на сервере в связке с движком магазина. На каком движке Вы смогли бы реализовать такой парсер? Это может быть любая подходящая и хорошо знакомая Вам опенсорсная CMS.
2. Парсер должен парсить только раздел автозапчасти http://allegro.pl/czesci-samochodowe-620 . В разделе около 24 тысяч категорий и подкатегорий, которые должны формировать такую же древовидную структуру как на сайте доноре.
3. При парсинге должны копироваться такие данные из карточки товара, а именно: Заголовок, номер лота, фотографии, состояние (новый или б/у). Желательно чтобы сами фотографии не скачивались, а парсились только ссылки на изображения на сервере allegro.
4. Также должна парсится и цена товара +доставка "pobraniowa" с возможностью ее дальнейшей конвертации, Злотый - Гривна или $ и умножения на нужный коэффициент заданный в админке.
5.Так как все названия на сайте доноре на польском языке то желательно чтобы при парсинге названия товаров переводились с польского на русский.
С гугл переводчиком наверно ничего не получится из-за неоправданной дороговизны (17миллионов названий товаров, каждое из которых состоит из как минимум 15-20 символов, нетрудно подсчитать в какую сумму обойдётся перевод такого объёма текста) и корявым переводом. В разделе почти все слова, это названия запчастей которые повторяются тысячи раз, всего же в автомобиле 5-10 тысяч наименований запчастей которые нужно перевести, плюс некоторое количество общепринятых слов таких как левый, правый, задний, передний и т д. Возможно ли осуществлять перевод при помощи какого-то специализированного промышленного словаря или может даже составить его самостоятельно? Какие могут быть варианты реализации подобного переводчика?
6. Товары при парсинге должны попадать в «правильные» соответствующие им категории и подкатегории товаров.
7. Должна быть возможность запускать парсер в автоматическом режиме по расписанию, скажем один раз в сутки. При этом парсер должен по номеру лота проверять наличие на сайте донора.
8. Парсер должен иметь возможность работать через прокси или другие анонимайзеры, на случай если сайт донор будет вводить какие либо ограничения.
9. Парсер должен иметь такую же форму поиска как и в http://www.global-cars.com.ua (марка, модель, поисковое окно для названия детали)
То есть пользователь выбирает в выпадающем списке формы марку автомобиля, далее в другом окошке формы становится доступен список моделей для данной марки и пользователь выбрав ее и введя название требуемой детали осуществляет поиск.
Хотелось бы получить от вас развёрнутый ответ с комментариями по каждому из требований к парсеру из списка выше.
-
322 22 0 1 Готов сотрудничать пишите в Skype: casper6132 обсудим детали.
Актуальні фриланс-проєкти в категорії PHP
Вирішити проблему навантаження на хостинг сайта на ПресташопСайт з кожним місяцем потребує більше і більше ресурсів. Відповідь хостера:Під час перевірки сервера було зафіксовано підвищене навантаження з боку сервера баз даних MySQL. У моменти виникнення помилки 500 процес MySQL використовує значну частину ресурсів процесора, що може… PHP, Бази даних та SQL ∙ 22 години 14 хвилин тому ∙ 26 ставок |
Потрібна інтеграція KeyCRM → ПРРО Кашалот |
Сайт на WordPress з використанням теми Kadence та Kadence Blocks.
10 000 UAH
Нам потрібно створити сайт на WordPress з використанням теми Kadence та Kadence Blocks. Інтернет-магазину не буде (хоча, ймовірно, він буде доданий у майбутньому). Потрібна головна сторінка та кілька внутрішніх сторінок. Графіка вже готова, структура макета здебільшого… CMS, PHP ∙ 2 дні 9 годин тому ∙ 37 ставок |
Розробка 2 SEO-орієнтованих сайтів з продажу запчастин (квадроцикли та спецтехніка)Розробка двох спеціалізованих сайтів з продажу запчастинЗагальна інформація Потрібно розробити два спеціалізовані сайти: Запчастини для квадроциклів, UTV, SSV та іншої подібної техніки. Запчастини для спеціальної техніки. Існуючий сайт компанії: https://kiaparts.com.ua/ Нові… PHP, Веб-програмування ∙ 3 дні 6 годин тому ∙ 76 ставок |
Розробка веб-сайту WordPress
1002 UAH
|