Парсер с сайта Allegro.pl
Список требований к парсеру:
1. Парсер должен работать онлайн на сервере в связке с движком магазина. На каком движке Вы смогли бы реализовать такой парсер? Это может быть любая подходящая и хорошо знакомая Вам опенсорсная CMS.
2. Парсер должен парсить только раздел автозапчасти http://allegro.pl/czesci-samochodowe-620 . В разделе около 24 тысяч категорий и подкатегорий, которые должны формировать такую же древовидную структуру как на сайте доноре.
3. При парсинге должны копироваться такие данные из карточки товара, а именно: Заголовок, номер лота, фотографии, состояние (новый или б/у). Желательно чтобы сами фотографии не скачивались, а парсились только ссылки на изображения на сервере allegro.
4. Также должна парсится и цена товара +доставка "pobraniowa" с возможностью ее дальнейшей конвертации, Злотый - Гривна или $ и умножения на нужный коэффициент заданный в админке.
5.Так как все названия на сайте доноре на польском языке то желательно чтобы при парсинге названия товаров переводились с польского на русский.
С гугл переводчиком наверно ничего не получится из-за неоправданной дороговизны (17миллионов названий товаров, каждое из которых состоит из как минимум 15-20 символов, нетрудно подсчитать в какую сумму обойдётся перевод такого объёма текста) и корявым переводом. В разделе почти все слова, это названия запчастей которые повторяются тысячи раз, всего же в автомобиле 5-10 тысяч наименований запчастей которые нужно перевести, плюс некоторое количество общепринятых слов таких как левый, правый, задний, передний и т д. Возможно ли осуществлять перевод при помощи какого-то специализированного промышленного словаря или может даже составить его самостоятельно? Какие могут быть варианты реализации подобного переводчика?
6. Товары при парсинге должны попадать в «правильные» соответствующие им категории и подкатегории товаров.
7. Должна быть возможность запускать парсер в автоматическом режиме по расписанию, скажем один раз в сутки. При этом парсер должен по номеру лота проверять наличие на сайте донора.
8. Парсер должен иметь возможность работать через прокси или другие анонимайзеры, на случай если сайт донор будет вводить какие либо ограничения.
9. Парсер должен иметь такую же форму поиска как и в http://www.global-cars.com.ua (марка, модель, поисковое окно для названия детали)
То есть пользователь выбирает в выпадающем списке формы марку автомобиля, далее в другом окошке формы становится доступен список моделей для данной марки и пользователь выбрав ее и введя название требуемой детали осуществляет поиск.
Хотелось бы получить от вас развёрнутый ответ с комментариями по каждому из требований к парсеру из списка выше.
-
322 22 0 1 Готов сотрудничать пишите в Skype: casper6132 обсудим детали.
Current freelance projects in the category Data Parsing
Database of websites on WooCommerceIt is necessary to compile a database of Ukrainian online store websites on WooCommerce with the contact information provided on the sites. Only active websites (indicator: updated catalog/content, working domain) Table format - website address, phone number, e-mail. Data Parsing ∙ 1 hour 56 seconds back ∙ 7 proposals |
Create a dashboard in https://airtable.com/ for the performance of advertising creatives from Facebook ads.Full specification https://docs.google.com/document/d/1_n_oYRNZWYxalUA---DM5AD1b5ZSrtePw5J4G42svGw/edit?usp=sharing Databases & SQL, Data Parsing ∙ 1 day 15 hours back ∙ 17 proposals |
Creation of an Excel file for uploading products to the websites of other partners.I am interested in creating an Excel table with all parameters. Here is the website - https://heiztechnik.com.ua/ And the positions I am interested in to be transferred: Manual boilers: 1) TIS UNI 15-95 kW (10) pcs 2)TIS HARD 150-500 kW (7) pcs Pellet boilers: 1)TIS PELLET… Data Parsing ∙ 1 day 19 hours back ∙ 34 proposals |
A developer is required for parsing the catalog and automating data import.Detailed technical specifications in the attached document Please indicate the estimated cost and timeline in your response Do you have experience working with parsing large catalogs What possible difficulties or limitations do you see in this task Databases & SQL, Data Parsing ∙ 1 day 22 hours back ∙ 39 proposals |
Find a product feed (Google Merchant XML) for a website on OpenCart
16 USD
It is necessary to find a direct link to the active product feed (XML) of a competitor for Google Merchant Center Platform (CMS): OpenCart / ocStore Find the original feedRequirements for the result: Working link to the XML file Python, Data Parsing ∙ 2 days 3 hours back ∙ 21 proposals |