Парсер на Python + загрузка в Woocommerce IP + обновление цен
# Инструмент Автоматизации E-commerce: Синхронизация Цены и Наличия (WooCommerce)
## Обзор Проекта
Этот скрипт на Python разработан для **полной автоматизации процесса наполнения и обновления товарного каталога** на платформе WooCommerce/WordPress на основе данных от внешнего поставщика (web-scraping).
Проект демонстрирует навыки разработки надежных парсеров, автоматизации бизнес-логики (обновление цены/наличия) и глубокой интеграции с API E-commerce систем.
---
## Ключевые Возможности
* **Автоматизация Каталога:** Скрипт решает проблему ручного обновления цен и создания новых товаров.
* **Web Scraping (Парсинг):**
* Сбор ссылок на все товары из указанной категории поставщика.
* Извлечение ключевых данных: название, цена, полный описание, характеристики, ссылка на изображение и видео.
* Использование `requests`, `BeautifulSoup`, `fake-useragent` для обхода и обработки контента.
* **API-Интеграция с WooCommerce:** Использование официальной библиотеки `python-woocommerce` для:
* **Обновления Цены:** Если товар существует, скрипт проверяет актуальность цены и обновляет ее, если она изменилась.
* **Создания Новых Товаров:** При отсутствии товара он автоматически создается в WooCommerce.
* **Управления Атрибутами:** Автоматически проверяет наличие атрибутов (например, "Бренд", "Компрессор", "WI-FI") и **создает их через API** при необходимости.
* **Обработка Контента:**
* Транслитерация названий товаров для генерации корректных `slug`.
* Парсинг и сохранение изображений описания локально для дальнейшей загрузки на сервер.
* Создание короткого HTML-описания (`short_description`) на основе ключевых характеристик.
* **Управление Состоянием:** Используются переменные для переключения категорий и бренда (для разных поставщиков).
---
## Используемые Технологии
| Категория | Технология | Описание |
| :--- | :--- | :--- |
| **Основной Язык** | Python | |
| **Парсинг** | `BeautifulSoup`, `requests` | Извлечение данных из HTML-страниц. |
| **E-commerce API** | `python-woocommerce` | Взаимодействие с API WordPress/WooCommerce для CRUD-операций. |
| **Обфускация** | `fake-useragent` | Имитация реального пользователя для предотвращения блокировки. |
| **Транслитерация** | `unidecode` | Генерация корректных SEO-friendly `slug` (понятных URL-адресов). |
| **Файловая система** | `os`, `re` | Управление путями, регулярные выражения. |
## Обзор Проекта
Этот скрипт на Python разработан для **полной автоматизации процесса наполнения и обновления товарного каталога** на платформе WooCommerce/WordPress на основе данных от внешнего поставщика (web-scraping).
Проект демонстрирует навыки разработки надежных парсеров, автоматизации бизнес-логики (обновление цены/наличия) и глубокой интеграции с API E-commerce систем.
---
## Ключевые Возможности
* **Автоматизация Каталога:** Скрипт решает проблему ручного обновления цен и создания новых товаров.
* **Web Scraping (Парсинг):**
* Сбор ссылок на все товары из указанной категории поставщика.
* Извлечение ключевых данных: название, цена, полный описание, характеристики, ссылка на изображение и видео.
* Использование `requests`, `BeautifulSoup`, `fake-useragent` для обхода и обработки контента.
* **API-Интеграция с WooCommerce:** Использование официальной библиотеки `python-woocommerce` для:
* **Обновления Цены:** Если товар существует, скрипт проверяет актуальность цены и обновляет ее, если она изменилась.
* **Создания Новых Товаров:** При отсутствии товара он автоматически создается в WooCommerce.
* **Управления Атрибутами:** Автоматически проверяет наличие атрибутов (например, "Бренд", "Компрессор", "WI-FI") и **создает их через API** при необходимости.
* **Обработка Контента:**
* Транслитерация названий товаров для генерации корректных `slug`.
* Парсинг и сохранение изображений описания локально для дальнейшей загрузки на сервер.
* Создание короткого HTML-описания (`short_description`) на основе ключевых характеристик.
* **Управление Состоянием:** Используются переменные для переключения категорий и бренда (для разных поставщиков).
---
## Используемые Технологии
| Категория | Технология | Описание |
| :--- | :--- | :--- |
| **Основной Язык** | Python | |
| **Парсинг** | `BeautifulSoup`, `requests` | Извлечение данных из HTML-страниц. |
| **E-commerce API** | `python-woocommerce` | Взаимодействие с API WordPress/WooCommerce для CRUD-операций. |
| **Обфускация** | `fake-useragent` | Имитация реального пользователя для предотвращения блокировки. |
| **Транслитерация** | `unidecode` | Генерация корректных SEO-friendly `slug` (понятных URL-адресов). |
| **Файловая система** | `os`, `re` | Управление путями, регулярные выражения. |