Парсер для сбора данных с Розетки рейтинга товаров
Необходимо сделать парсер для сбора данных с Розетки и заполнения их в таблицу.
Пример таблицы по ссылке:
Таблица нужна для анализа рейтинга товаров в выдаче Розетка. В таблице для примера добавлено 4 товара. По факту товаров может быть любое количество товаров.
Колонки A, B – обязательные для заполнения, их значения заполняет человек. Колонку C, D, E заполняет парсер. Колонки F, G свободные и не обязательные, их может быть любое количество или не быть вообще, они создаются человеком с любыми шапками и значениями. Колонки H и далее правее заполняются парсером.
Колонка «Поисковый запрос» - запрос, который вводится в поиск.
Колонка «Название товара» - название товара по ссылке.
Колонка «Категория товара» - название конечной категории товара (пример на скриншоте).
Колонка «Категория да/нет». Если поисковый запрос ведет в категорию товара, пример ссылки https://bt.rozetka.com.ua/ua/252133/c252133/ , то значение «да», если не ведет, и запрос остается поисковым, пример ссылки https://rozetka.com.ua/ua/search/?text=%D1%84%D0%BE%D1%82%D0%BE%D0%B5%D0%BF%D1%96%D0%BB%D1%8F%D1%82%D0%BE%D1%80§ion_id=252133&redirected=1 , то значение «нет».
Колонка "Поиск". По каждому поисковому запросу в таблицу заполняется место в рейтинге выдачи. Заливается зеленым цветом, если место с 1 по 5, желтым, если место с 6 по 20, оранжевым, если место ниже 21, но на первой странице, красным, если товар на второй странице и ниже. Если товар не найден, то ставится знак прочерка и красный цвет. В выдаче товаров есть рекламные места, они обозначены словом «Реклама» (пример на скриншоте), если товар имеет такое место, то к числу добавляется «рек».
Колонка "Реклама". По каждому поисковому запросу в таблицу заполняется место в рекламной выдаче на странице слева направо, если товара нет, то указывается знак прочерка, в скобках количество рекламных предложений на странице. Заливается зеленым цветом, если 1 товар в топ 10, желтым, если ниже 10 места, но есть в рекламе, красным, если в рекламной выдаче нет. Рекламная выдача находится в карточках товаров (пример на скриншоте), парсер смотрит в первой карточке органической выдачи. Если в первой карточке рекламной выдачи нет, то смотрит во второй, если в ней нет, то в третьей, если в третьей нет, ставит значение «-» и цветом не помечает.
Колонка «Топ продаж». Если на карточке указано «Топ продаж» (пример на скриншоте) - значение «да» зеленым цветом, если нет, то значение «нет» желтым цветом. Если карточка имеет рекламное место в органической выдаче, то «Топ продаж» может в выдаче не показывать, а только в карточке, тогда нужно посмотреть в карточке (пример на скриншоте).
Парсер собирает данные в таблицу каждый день по всем товарам, внесенным в таблицу, в час, который указывается человеком при настройке. История парсинга должна сохраняться, то есть в таблицу добавляются новые данные, а старые остаются в ней. Если таблица закончится, делается вторая такая же, и парсер заполняет ее. Старые таблицы все сохраняются.
В настройке парсинга человек указывает количество страниц выдачи для сбора данных. При добавлении ссылок на товары должна быть возможность добавления списком ссылок. Товары располагаются в таблице сверху вниз по алфавиту первой буквы названия.
Парсер должен работать через режим Инкогнито, чтобы история и куки не мешали парсеру видеть правильную выдачу товаров.
Необходимо сделать доступ через веб браузер через логин и пароль. Пользователь сам регистрируется через свой любой логин, пароль, а админ подтверждает его регистрацию, и тогда пользователь получает доступ. При необходимости, админ удаляет пользователя, и доступ у пользователя исчезает. Количество пользователей неограничено.
После выполнения и приемки проекта нужна его поддержка впоследствии, чтобы парсер работал без ошибок.
-
Привет, я работал над проектом для парсинга маркетплейса, где собирали данные сотен товаров каждый день ✅ Собрали более двух тысяч строк в таблице.
Правильно ли я понимаю, что нужна автоматическая обработка всех состояний рекламных позиций в выдаче Розетки?
Предлагаю связаться, я бесплатно проконсультирую вас с технической стороны и составим план разработки + расскажу о моей команде!