Парсер товаров
Нужно спарсить товары из данной категории
https://vencon(крапка)ua/ua/catalog/multisplit-sistemy
А именно
Требуется исходный файл с 3 колонками.
1) Артикул(код) товара
2) Артикулы вариантов товаров
3) Названия типов характеристик
4) Контроль (контрольная колонка) - значение для логической проверки как проконтролировать работу парсера
Например аналог из другой категории
артикул(код) - 303118
варианты - 301277,303118, 303132,303133,301495
Названия типов характеристик - Площадь помещения, м²
Количество - 5
Особенность - в этой категории есть как прямые URL, так и функционал модального окна с "перебором".
Есть пример готового файла, который выдает базовый парсер (жёлтым обозначены колонки, которые нужно доработать для правильной работы).
Базовый парсер работает на пайтоне.
Требуется файл на Python, который я запущу в VS, и он будет работать и забирать из донора эти 3 колонки.
Сейчас есть готовый парсер, который извлекает и обрабатывает все необходимые колонки. Проблема в категории, которая указана в задаче.
Чтобы не писать новый — нужно решение для колонки Артикули вариантов
Вот, например, часть, которая не справляется с задачей
def get_article_from_url(url):
try:
response = requests.get(url, headers=HEADERS, timeout=15)
if response.status_code != 200:
return ""
soup = BeautifulSoup(response.text, "html.parser")
tag = soup.find("span", class_="article-number")
return tag.get_text(strip=True).replace("Код:", "").strip() if tag else ""
except:
return ""
.....
variant_links, variant_articles = [], []
if not skip("Посилання на варіанти") or not skip("Артикули варіантів"):
variant_buttons = soup.select(".same-series-products-switcher .variants button")
for btn in variant_buttons:
data_url = btn.get("data-url")
if data_url:
full_url = urljoin("https://vencon.ua", data_url)
if not skip("Посилання на варіанти"):
variant_links.append(full_url)
if not skip("Артикули варіантів"):
variant_articles.append(get_article_from_url(full_url))
Потрібен Файлик пайтон який я запущу в VS і він працюватиме і забиратиме з донора цих 3 колонки.
Зараз є готовий парсер який всі потрібні колонки витягує та опрацьовує. Проблема в категорії яка вказана в задачі.
Щоб не писати новий - потрібно рішення для колонки Артикули варіантів
ось наприклад частина яка не справляєьться з задачею
def get_article_from_url(url):
try:
response = requests.get(url, headers=HEADERS, timeout=15)
if response.status_code != 200:
return ""
soup = BeautifulSoup(response.text, "html.parser")
tag = soup.find("span", class_="article-number")
return tag.get_text(strip=True).replace("Код:", "").strip() if tag else ""
except:
return ""
.....
variant_links, variant_articles = [], []
if not skip("Посилання на варіанти") or not skip("Артикули варіантів"):
variant_buttons = soup.select(".same-series-products-switcher .variants button")
for btn in variant_buttons:
data_url = btn.get("data-url")
if data_url:
full_url = urljoin("https://vencon.ua", data_url)
if not skip("Посилання на варіанти"):
variant_links.append(full_url)
if not skip("Артикули варіантів"):
variant_articles.append(get_article_from_url(full_url))
Приложения 3
-
313 Привет!
Готова выполнить ваше задание. Имела опыт в таком проекте. Буду рада помочь - Обращайтесь.
-
571 6 1 1 Привет, Тимур!
У меня более четырехлетний опыт в Python-разработке, и я готов качественно и быстро реализовать ваш парсер товаров. Проблемы с получением данных из модального окна решу с помощью Selenium, а для обычных URL использую BeautifulSoup. Гарантирую надежный исходный файл с нужными колонками для контроля качества. Давайте вместе сделаем ваш проект успешным!
-
297 2 0 Добрый день!
Есть опыт в автоматизации и работе с парсерами — подобные задачи уже выполнял. Могу доработать скрипт так, чтобы он корректно извлекал варианты артикулов и характеристики, даже если они открываются через модальные окна или загружаются динамически.
Сделаю результат в нужном формате (артикул, варианты, характеристики + контрольная колонка). Если есть существующий код — адаптирую его, или напишу новое решение под ваши условия.
Пишите — посмотрю сайт и оперативно включусь.
-
414 1 0 Здравствуйте,готов реализовать парсер. Предлагаю перейти в ЛС там обсудим и начнем сотрудничество
-
5780 153 4 3 Добрый день, Тимур! Я готов сделать эту работу для вас. Обращайтесь!
-
486 23 0 Добрый день.
Могу выполнить задачу, не очень все понятно сразу, если напишете тогда можно уже более детально ознакомиться с сайтом, и сказать цену и сроки.
Больше 7 лет занимаюсь парсингом и написанием программ.
-
7399 230 0 Готов выполнить
Готов выполнить
Готов выполнить
Готов выполнить
Готов выполнить
Актуальные фриланс-проекты в категории Python
Улучшение макроса
702 UAH
Необходимо улучшить уже существующий макрос. Сам макрос, возможно, простой, не знаю, потому что мне его передал предыдущий сотрудник. Используется макрос для создания спецификаций. Так как я работаю в розничной торговле, то для каждой операции с поставщиком, а именно поставками,… Python ∙ 5 часов 47 минут назад ∙ 11 ставок |
Создание Тик-ток фермы с генерацией дохода
27 000 UAH
в поиске человека, который может написать софт, для фермы тик ток, чтобы мы смогли генерировать трафик, получать доход. Ищем готовое решение с полным циклом. Python, Разработка ботов ∙ 1 день 6 часов назад ∙ 15 ставок |
AI Commenting Platform для TikTok и Instagram.Цель проекта Разработать систему, которая позволяет управлять большим количеством аккаунтов TikTok и Instagram и автоматически публиковать релевантные комментарии под выбранными видео с использованием ИИ. Основной функционал1. Управление аккаунтами Необходимо реализовать… AI и машинное обучение, Python ∙ 2 дня 13 часов назад ∙ 22 ставки |
Построить модель классификации клиентов1. Есть данные клиентов в Mongo/SQL (примерно 20 000 записей с сырыми данными). 2. Необходимо на их основе построить фичи и модель классификации клиентов на поведенческие группы. 3. Проект выполнить на Python. AI и машинное обучение, Python ∙ 4 дня 7 часов назад ∙ 43 ставки |
ИТ Автоматизация ведения VAT-отчетности
10 000 UAH
Необходимо разработать систему для автоматизации переноса данных о продажах из CRM в бухгалтерскую систему Wafeq. Система должна импортировать банковские и платежные отчеты, автоматически сверять платежи с инвойсами, формировать инвойсы для VAT-отчетности и минимизировать ручную… AI и машинное обучение, Python ∙ 4 дня 13 часов назад ∙ 51 ставка |