Ceneo.pl парсер
Это приложение для сбора данных о товарах с сайта Ceneo.pl.
Возможности:
- Автоматический сбор данных: Собирает информацию о товарах (название, ID, цена, наличие) со всех страниц категории.
- Обработка пагинации: Автоматически переходит на следующие страницы категории.
- Извлечение данных из JSON-LD: Находит и извлекает данные о товарах из JSON-LD разметки на странице.
- Сохранение в Excel: Сохраняет собранные данные в файл Excel с отдельными листами для каждой категории.
- Удобный интерфейс: Позволяет легко выбрать файл с ссылками на категории и файл для сохранения результатов.
- Логирование: Отображает ход выполнения парсинга в окне приложения.
Легко использовать:
- Выберите файл с ссылками на категории Ceneo.pl.
- Выберите файл Excel для сохранения данных.
- Нажмите "Начать парсинг".
Технологии:
- PyQt5: для создания графического интерфейса.
- Playwright: для автоматизации браузера и взаимодействия с веб-страницами.
- Pandas: для обработки и сохранения данных в Excel.
- JSON: для работы с JSON-LD данными.
Возможности:
- Автоматический сбор данных: Собирает информацию о товарах (название, ID, цена, наличие) со всех страниц категории.
- Обработка пагинации: Автоматически переходит на следующие страницы категории.
- Извлечение данных из JSON-LD: Находит и извлекает данные о товарах из JSON-LD разметки на странице.
- Сохранение в Excel: Сохраняет собранные данные в файл Excel с отдельными листами для каждой категории.
- Удобный интерфейс: Позволяет легко выбрать файл с ссылками на категории и файл для сохранения результатов.
- Логирование: Отображает ход выполнения парсинга в окне приложения.
Легко использовать:
- Выберите файл с ссылками на категории Ceneo.pl.
- Выберите файл Excel для сохранения данных.
- Нажмите "Начать парсинг".
Технологии:
- PyQt5: для создания графического интерфейса.
- Playwright: для автоматизации браузера и взаимодействия с веб-страницами.
- Pandas: для обработки и сохранения данных в Excel.
- JSON: для работы с JSON-LD данными.