Прайс-агрегатор (парсинг и матчинг товаров с интернет-магазинов)
Нужно создать прайс-агрегатор включая парсинг и матчинг товаров. Основная проблема которую хотим решить - получение обновляемого регулярного фида сматченых товаров из разных магазинов.
План-минимум - ежедневно обновляемый фид сматченых товаров.
Структурные блоки прайс-агрегатора:
1. Карточка товара с картинками, описаниями и характеристиками товаров. Саму карточку и характеристики товаров нужно спарсить. Один и тот же товар в разных интернет магазинах может называться по разному и иметь различный артикул. Товар должен матчиться и привязываться к карточке товаров. Внутри карточки видно стоимость и наличие по магазинам и есть возможность сортировки/фильтрации.
2. Категоризатор с деревом категорий. В разных магазинах категории/подкатегории имеют разную структуру и называются по разному, нужно чтобы они парсились и правильно матчились.
3. База товаров, наличия и цен. Цены и наличие товаров должны ежедневно обновляться. В базе может быть 200,000-2,000,000 товаров. Магазинов с которых нужно парсить может быть 1000-3000. Для старта можно ограничиться 100,000 товаров и 50 магазинами.
4. Фильтры. Возможность фильтровать товары по характеристикам. В каждой группе товаров должны быть свои фильтры (для обуви - размер, цвет, материал, бренд, утепление и т.д., а в пылесосе - тип пылесборник, тип уборки, мощность всасывания, насадки, вес и т.д.). Характеристики и фильтры для каждой категории нужно спарсить.
Примеры магазинов для парсинга: mvideo, эльдорадо, связной, lamoda, asos, Перекресток, Остин.
Примеры похожих проектов: hotline.ua, e-katalog.ru, yandex market.
-
Автоматический матчинг — сбор информации с сайтов интернет-магазинов и автоматические сопоставление с вашим ассортиментом.
1. Карточка товара с картинками, описаниями и характеристиками товаров. Саму карточку и характеристики товаров нужно спарсить.
Если у Вас есть свой ассортимент тогда это матчинг. А то что Вы накатали просто парсер. -
Каждый сайт имеет свою структуру и требует написания отдельных правил парсинга. Сайты типа hotline не парсеры, в них люди самостоятельно загружают прайс-листы. Hotline-бот не ходит по сайтам. Вы готовы оплачивать написание такого количества парсеров? А если сайт изменит структуру, то парсер необходимо переписывать. А если забанит?
Разные сайты могут называть разные товары одинаково. Как предполагается их различать?
Количество товаров в вашем проекте не имеет значения для того, кто умеет грамотно организовать структуру. -
То, что вы хотите сделать - понятно. Подход изначально ошибочен. В предидущем посте вам кратко изложили технические сложности. А есть еще финансовые, административные, правовые, сеошные. В общем, нужно либо делать по-другому, либо вложить кучу бобла в разработку ПО и коллектив, и затем, с высокой степенью вероятности, их назад не вернуть. Та работа, которую вы описали - я даже примерно затрудняюсь ее оценить, но это очень дорого. И работать должна команда. Если кто-то возьмется все сделать один и за неделю - это развод.
-
Да Вы что не поняли он хочет искусственный интеллект)))
-
Я готов воплощать любые хотелки клиента, особенно на постоянной основе. Но и чтобы клиент отдавал себе отчёт в том, что его проект будет представлять и как будет реализован, и за какую цену
-
Актуальные фриланс-проекты в категории Парсинг данных
Требуется специалист по продвижению в Telegram.
1286 UAH
Задачи: инвайт реальных пользователей по базе юзернеймов в новые чаты и рассылка сообщений по целевой базе. Интересует только качественный трафик и работа с живой аудиторией — исполнителей, использующих ботов, накрутку или некачественные методы, просьба НЕ БЕСПОКОИТЬ. Работа… Парсинг данных, Продвижение в социальных сетях (SMM) ∙ 2 дня 1 час назад ∙ 8 ставок |
Сбор B2B базы данных компаний в Германии
1801 UAH
Цель: Получение списка потенциальных работодателей (клиентов) для B2B рассылки. Регион: Мюнхен (München) + радиус 50 км. Требуемые ниши: Строительные компании (Bauunternehmen) Пищевые предприятия (Lebensmittelhersteller, мясокомбинаты, пекарни) Логистика и складские… Парсинг данных, Продажи и генерация лидов ∙ 2 дня 3 часа назад ∙ 32 ставки |
Консультация по парсингу подписчиков Instagram-аккаунтовЗдравствуйте. Необходимо провести предварительную оценку возможности выполнения следующей задачи. У меня есть список Instagram-аккаунтов. Цель — получить контактные данные (в первую очередь email-адреса) пользователей, которые подписаны на эти аккаунты. Ранее мне встречались… Парсинг данных ∙ 5 дней 20 часов назад ∙ 12 ставок |
Нужен специалист для поиска контактов ЛПР по УкраинеНеобходимо собрать базу (или готовую базу) контактов лиц, принимающих решения (ЛПР), в компаниях Украины. Поиск и сбор информации, Парсинг данных ∙ 6 дней 1 час назад ∙ 19 ставок |
Необходимо спарсить данные из LinkedinНеобходимо спарсить данные с Linkedin по нашему списку. Для каждой записи нужно найти и собрать доступные данные, если такие есть на Linkedin профиле, включая фотографию профиля в соцсети Linkedin, email-адрес, ссылки на социальные сети, вебсайт компании, номер телефона. Все… Парсинг данных ∙ 6 дней 6 часов назад ∙ 28 ставок |