Парсер на Python + завантаження в Woocommerce API+ оновлення цін
# Інструмент Автоматизації E-commerce: Синхронізація Ціни та Наявності (WooCommerce)
## Огляд Проєкту
Цей скрипт на Python розроблено для **повної автоматизації процесу наповнення та оновлення товарного каталогу** на платформі WooCommerce/WordPress на основі даних від зовнішнього постачальника (web-scraping).
Проєкт демонструє навички розробки надійних парсерів, автоматизації бізнес-логіки (оновлення ціни/наявності) та глибокої інтеграції з API E-commerce систем.
---
## Ключові Можливості
* **Автоматизація Каталогу:** Скрипт вирішує проблему ручного оновлення цін та створення нових товарів.
* **Web Scraping (Парсинг):**
* Збір посилань на всі товари з вказаної категорії постачальника.
* Вилучення ключових даних: назва, ціна, повний опис, характеристики, посилання на зображення та відео.
* Використання `requests`, `BeautifulSoup`, `fake-useragent` для обходу та обробки контенту.
* **API-Інтеграція з WooCommerce:** Використання офіційної бібліотеки `python-woocommerce` для:
* **Оновлення Ціни:** Якщо товар існує, скрипт перевіряє актуальність ціни та оновлює її, якщо вона змінилася.
* **Створення Нових Товарів:** За відсутності товару він автоматично створюється у WooCommerce.
* **Керування Атрибутами:** Автоматично перевіряє наявність атрибутів (наприклад, "Бренд", "Компресор", "WI-FI") та **створює їх через API** за необхідності.
* **Обробка Контенту:**
* Транслітерація назв товарів для генерації коректних `slug`.
* Парсинг та збереження зображень опису локально для подальшого завантаження на сервер.
* Створення короткого HTML-опису (`short_description`) на основі ключових характеристик.
* **Керування Станом:** Використовуються змінні для перемикання категорій та бренду (для різних постачальників).
---
## Використовувані Технології
| Категорія | Технологія | Опис |
| :--- | :--- | :--- |
| **Основна Мова** | Python | |
| **Парсинг** | `BeautifulSoup`, `requests` | Вилучення даних із HTML-сторінок. |
| **E-commerce API** | `python-woocommerce` | Взаємодія з API WordPress/WooCommerce для CRUD-операцій. |
| **Обфускація** | `fake-useragent` | Імітація реального користувача для запобігання блокуванню. |
| **Транслітерація** | `unidecode` | Генерація коректних SEO-friendly `slug` (зрозумілих URL-адрес). |
| **Файлова система** | `os`, `re` | Керування шляхами, регулярні вирази. |
## Огляд Проєкту
Цей скрипт на Python розроблено для **повної автоматизації процесу наповнення та оновлення товарного каталогу** на платформі WooCommerce/WordPress на основі даних від зовнішнього постачальника (web-scraping).
Проєкт демонструє навички розробки надійних парсерів, автоматизації бізнес-логіки (оновлення ціни/наявності) та глибокої інтеграції з API E-commerce систем.
---
## Ключові Можливості
* **Автоматизація Каталогу:** Скрипт вирішує проблему ручного оновлення цін та створення нових товарів.
* **Web Scraping (Парсинг):**
* Збір посилань на всі товари з вказаної категорії постачальника.
* Вилучення ключових даних: назва, ціна, повний опис, характеристики, посилання на зображення та відео.
* Використання `requests`, `BeautifulSoup`, `fake-useragent` для обходу та обробки контенту.
* **API-Інтеграція з WooCommerce:** Використання офіційної бібліотеки `python-woocommerce` для:
* **Оновлення Ціни:** Якщо товар існує, скрипт перевіряє актуальність ціни та оновлює її, якщо вона змінилася.
* **Створення Нових Товарів:** За відсутності товару він автоматично створюється у WooCommerce.
* **Керування Атрибутами:** Автоматично перевіряє наявність атрибутів (наприклад, "Бренд", "Компресор", "WI-FI") та **створює їх через API** за необхідності.
* **Обробка Контенту:**
* Транслітерація назв товарів для генерації коректних `slug`.
* Парсинг та збереження зображень опису локально для подальшого завантаження на сервер.
* Створення короткого HTML-опису (`short_description`) на основі ключових характеристик.
* **Керування Станом:** Використовуються змінні для перемикання категорій та бренду (для різних постачальників).
---
## Використовувані Технології
| Категорія | Технологія | Опис |
| :--- | :--- | :--- |
| **Основна Мова** | Python | |
| **Парсинг** | `BeautifulSoup`, `requests` | Вилучення даних із HTML-сторінок. |
| **E-commerce API** | `python-woocommerce` | Взаємодія з API WordPress/WooCommerce для CRUD-операцій. |
| **Обфускація** | `fake-useragent` | Імітація реального користувача для запобігання блокуванню. |
| **Транслітерація** | `unidecode` | Генерація коректних SEO-friendly `slug` (зрозумілих URL-адрес). |
| **Файлова система** | `os`, `re` | Керування шляхами, регулярні вирази. |