Бот парсер новинного сайту, з генерацією постів через GPT
Це автоматизований бот, який парсить новини з сайту Української правди (pravda.com.ua), фільтрує їх за ключовими словами та часом публікації (не старше 2 годин), генерує короткі змісти за допомогою ChatGPT (GPT-4) та надсилає адміністраторам на модерацію. Після схвалення бот публікує новини в Telegram-каналі.
Основні функції:
Автоматичний парсинг новин кожну годину
Фільтрація за ключовими словами
Генерація коротких змістів за допомогою GPT-4
Модерація через кнопки ( Схвалити / Відхилити)
Автопублікація в Telegram-каналі після схвалення
Захист від дублікатів (не обробляє вже надіслані посилання)
Використовувані технології:
Python 3.11+ (асинхронний код, asyncio, aiohttp)
Aiogram 3.x (Telegram Bot API)
BeautifulSoup4 (парсинг HTML)
APScheduler (планувальник завдань)
GPT-4 API (через g4f для генерації контенту)
Logging (логування роботи бота)
Чому цей проект корисний?
Автоматизує рутинну роботу – не потрібно вручну шукати новини.
Економить час – GPT-4 сам пише короткі змісти.
Гнучкість – можна змінювати ключові слова та джерела.
Масштабованість – можна додати інші новинні сайти.
Стек: Python, Aiogram, GPT-4, BeautifulSoup, APScheduler
Основні функції:
Автоматичний парсинг новин кожну годину
Фільтрація за ключовими словами
Генерація коротких змістів за допомогою GPT-4
Модерація через кнопки ( Схвалити / Відхилити)
Автопублікація в Telegram-каналі після схвалення
Захист від дублікатів (не обробляє вже надіслані посилання)
Використовувані технології:
Python 3.11+ (асинхронний код, asyncio, aiohttp)
Aiogram 3.x (Telegram Bot API)
BeautifulSoup4 (парсинг HTML)
APScheduler (планувальник завдань)
GPT-4 API (через g4f для генерації контенту)
Logging (логування роботи бота)
Чому цей проект корисний?
Автоматизує рутинну роботу – не потрібно вручну шукати новини.
Економить час – GPT-4 сам пише короткі змісти.
Гнучкість – можна змінювати ключові слова та джерела.
Масштабованість – можна додати інші новинні сайти.
Стек: Python, Aiogram, GPT-4, BeautifulSoup, APScheduler