Парсер товарів
Потрібно спарсити товари з даної категорії
https://vencon(крапка)ua/ua/catalog/multisplit-sistemy
А саме
Потрібен вихідний файл з 3 колонками.
1) Артикул(код) товару
2) Артикула Варіантів товарів
3) Назви типів характеристик
4) Контроль (контрольна колонка) - значення для логічної перевірки як проконтрольювати роботу парсеру
Наприклад аналог з іншої категорії
артикул(код) - 303118
варіанти - 301277,303118, 303132,303133,301495
Назви типів характеристик - Площа приміщення, м²
Кількість - 5
Нюанс - у цій категорії є як беспосередні URL так і функціонал модального вікна з "перебором".
Є приклад готового файлу який видає базовий парсер(жовтим позначено колонки як потрібно доопрацювати на правильну роботу).
Базовий парсер працює на пайтон.
Потрібен Файл пайтон, який я запущу у VS і він працюватиме та забиратиме з донора ці три колонки.
Зараз є готовий парсер, який всі потрібні колонки витягує та опрацьовує. Проблема в категорії, яка вказана в задачі.
Щоб не писати новий - потрібно рішення для колонки Артикули варіантів
ось, наприклад, частина, яка не справляється з завданням
def get_article_from_url(url):
try:
response = requests.get(url, headers=HEADERS, timeout=15)
if response.status_code != 200:
return ""
soup = BeautifulSoup(response.text, "html.parser")
tag = soup.find("span", class_="article-number")
return tag.get_text(strip=True).replace("Код:", "").strip() if tag else ""
except:
return ""
.....
variant_links, variant_articles = [], []
if not skip("Посилання на варіанти") or not skip("Артикули варіантів"):
variant_buttons = soup.select(".same-series-products-switcher .variants button")
for btn in variant_buttons:
data_url = btn.get("data-url")
if data_url:
full_url = urljoin("https://vencon.ua", data_url)
if not skip("Посилання на варіанти"):
variant_links.append(full_url)
if not skip("Артикули варіантів"):
variant_articles.append(get_article_from_url(full_url))
Потрібен Файлик пайтон який я запущу в VS і він працюватиме і забиратиме з донора цих 3 колонки.
Зараз є готовий парсер який всі потрібні колонки витягує та опрацьовує. Проблема в категорії яка вказана в задачі.
Щоб не писати новий - потрібно рішення для колонки Артикули варіантів
ось наприклад частина яка не справляєьться з задачею
def get_article_from_url(url):
try:
response = requests.get(url, headers=HEADERS, timeout=15)
if response.status_code != 200:
return ""
soup = BeautifulSoup(response.text, "html.parser")
tag = soup.find("span", class_="article-number")
return tag.get_text(strip=True).replace("Код:", "").strip() if tag else ""
except:
return ""
.....
variant_links, variant_articles = [], []
if not skip("Посилання на варіанти") or not skip("Артикули варіантів"):
variant_buttons = soup.select(".same-series-products-switcher .variants button")
for btn in variant_buttons:
data_url = btn.get("data-url")
if data_url:
full_url = urljoin("https://vencon.ua", data_url)
if not skip("Посилання на варіанти"):
variant_links.append(full_url)
if not skip("Артикули варіантів"):
variant_articles.append(get_article_from_url(full_url))
Додатки 3
-
313 Вітаю!
Готова виконати ваше завдання. Мала досвід над таким проектом. Буду рада допомогти - Звертайтеся.
-
571 6 1 1 Привіт, Тимур!
Я маю понад чотирирічний досвід у Python-розробці, і готовий якісно та швидко реалізувати ваш парсер товарів. Проблеми з отриманням даних з модального вікна вирішу за допомогою Selenium, а для звичайних URL використаю BeautifulSoup. Гарантую надійний вихідний файл з потрібними колонками для контролю якості. Давайте разом зробимо ваш проект успішним!
-
297 2 0 Доброго дня!
Є досвід в автоматизації та роботі з парсерами — подібні задачі вже робив. Можу доопрацювати скрипт так, щоб він коректно витягував варіанти артикулів і характеристики, навіть якщо вони відкриваються через модальні вікна чи завантажуються динамічно.
Зроблю результат у потрібному форматі (артикул, варіанти, характеристики + контрольна колонка). Якщо є існуючий код — адаптую його, або напишу нове рішення під ваші умови.
Пишіть — гляну сайт і оперативно включусь.
-
414 1 0 Привіт, готовий реалізувати парсер. Пропоную перейти в ЛС, там обговоримо і почнемо співпрацю
-
5801 152 4 3 Добрий день, Тимуре! Я готовий зробити цю роботу для вас. Звертайтеся!
-
486 23 0 Добрий день.
Можу виконати задачу, недуже все понятно зразу, якщо напишете тоді можна вже більш детальніше обдивитися сайт, і сказати ціну та строки.
Більше 7 років займаюся парсингом і написанням програм.
-
7472 230 0 Готовий виконати
Готовий виконати
Готовий виконати
Готовий виконати
Готовий виконати
Актуальні фриланс-проєкти в категорії Python
Шукаю White-label рішення Букмекерської контори під оренду |
Куплю крипто/гемблинг/беттинг платформу !Якщо у вас є платформа або шаблон, ви знаєте логіку, у мене є команда байнгу на Латам і Європу, давайте спробуємо щось! Python, Веб-програмування ∙ 1 година 35 хвилин тому ∙ 9 ставок |
Створення Human AI Assistant для Telegram-групп### 1.1. Ключова концепція системи Система повинна виконувати дві основні функції: #### 1. Аналіз клієнтської комунікації AI-асистент має автоматично аналізувати всю комунікацію в Telegram-групах та розуміти контекст спілкування. Зокрема система повинна: - визначати… AI та машинне навчання, Python ∙ 1 день 1 година тому ∙ 37 ставок |
Чорна Україна (RP-проект на базі MTA)
51 525 UAH
|
Автоматизація розсилки повідомлень у чати TelegramПотрібно розсилати в телеграм чати повідомлення. Щоб не було банів. Чатів кілька сотень. Щоб налаштовувати періодичність і варіативність текстів. Python, Розробка ботів ∙ 1 день 2 години тому ∙ 30 ставок |