Универсальный инструмент командной строки для веб-скрапинга (Python, ООП)
Разработал гибкую CLI-утилиту для парсинга данных с веб-ресурсов. Вместо написания хардкода под каждый сайт, инструмент принимает целевой URL и селекторы (HTML-теги и классы) непосредственно через интерактивный терминал, динамически извлекая контент.
Технические детали:
Архитектура: Строгий ООП подход. Логика разделена на независимые модули: Scraper (ядро), Exporter (данные) и CLI.
Интерфейс: Интерактивный терминал на базе библиотеки rich (цветное логирование, прогресс-бары, превью результатов в виде таблицы).
Экспорт: Поддержка сохранения собранных данных в машиночитаемый формат .csv (через pandas) или в отформатированный текстовый отчет .txt (ASCII-таблицы).
Надежность: Обработка сетевых ошибок и валидация ввода.
#python #Backend #CLI #beautifulsoup4 #pandas
Технические детали:
Архитектура: Строгий ООП подход. Логика разделена на независимые модули: Scraper (ядро), Exporter (данные) и CLI.
Интерфейс: Интерактивный терминал на базе библиотеки rich (цветное логирование, прогресс-бары, превью результатов в виде таблицы).
Экспорт: Поддержка сохранения собранных данных в машиночитаемый формат .csv (через pandas) или в отформатированный текстовый отчет .txt (ASCII-таблицы).
Надежность: Обработка сетевых ошибок и валидация ввода.
#python #Backend #CLI #beautifulsoup4 #pandas