Пром парсер
Проект: PromParser
Функционал: Скрипт принимает ссылку на каталог продавца и автоматически проходит через все страницы пагинации (от первой до последней), собирая полную информацию о каждой товарной позиции.
Этапы работы скрипта:
1. Сбор ссылок (Playwright + Proxy): Браузерная автоматизация имитирует действия реального пользователя, переходит по страницам каталога и собирает ссылки на все карточки товаров. Использование прокси позволяет избежать блокировок.
2. Асинхронная загрузка (Aiohttp + Proxy): Скрипт мгновенно делает параллельные запросы к каждой собранной карточке товара. Это обеспечивает максимальную скорость работы по сравнению с обычными браузерными парсерами.
3. Структурирование данных (BeautifulSoup4): Извлечение из HTML-кода конкретных характеристик: название, прямая ссылка, цена и критически важный показатель — количество продаж.
4. Экспорт в отчет (Excel / Openpyxl): Данные сохраняются в Excel-таблицу с профессиональным форматированием: авто-подбором ширины столбцов, жирными заголовками и активными ссылками для удобной работы заказчика.
Функционал: Скрипт принимает ссылку на каталог продавца и автоматически проходит через все страницы пагинации (от первой до последней), собирая полную информацию о каждой товарной позиции.
Этапы работы скрипта:
1. Сбор ссылок (Playwright + Proxy): Браузерная автоматизация имитирует действия реального пользователя, переходит по страницам каталога и собирает ссылки на все карточки товаров. Использование прокси позволяет избежать блокировок.
2. Асинхронная загрузка (Aiohttp + Proxy): Скрипт мгновенно делает параллельные запросы к каждой собранной карточке товара. Это обеспечивает максимальную скорость работы по сравнению с обычными браузерными парсерами.
3. Структурирование данных (BeautifulSoup4): Извлечение из HTML-кода конкретных характеристик: название, прямая ссылка, цена и критически важный показатель — количество продаж.
4. Экспорт в отчет (Excel / Openpyxl): Данные сохраняются в Excel-таблицу с профессиональным форматированием: авто-подбором ширины столбцов, жирными заголовками и активными ссылками для удобной работы заказчика.