Парсер новин
Потрібно створити телеграм бота який буде відпраіляти мені всі новини в реальному часі з інтернет ресурсів які я надам(орієнтовно до 30) і з телеграм каналів(до 30). Але важливо щоб ші обробляв все і надсилав тільки унікальні новини без повторення по багато разів.
-
Привіт.
Ознайомився із завданням. Можу реалізувати для вас бота для моніторингу новин у реальному часі зі збором даних із сайтів і Telegram-каналів та фільтрацією дублікатів.
Зі свого боку можу закрити:
збір новин із до 30 сайтів;
підключення до 30 Telegram-каналів;
…
фільтрацію повторів не лише по точному тексту, а й по схожих новинах;
передачу тільки унікальних повідомлень у ваш Telegram;
базову логіку стабільної роботи, обробку помилок і можливість подальшого розширення.
Правильний підхід тут — не просто “парсити все підряд”, а зібрати стабільний контур моніторингу, де є:
джерела → обробка → перевірка на дублікати → відправка в Telegram.
Саме так система буде придатна для постійного використання, а не лише як разовий скрипт.
Працюю з Python, Telegram-ботами, парсингом, API та automation-сценаріями, тому можу зібрати це як зрозумілий MVP із нормальною основою для подальшого розвитку.
Термін: 5 днів
Вартість: 6 500 грн
Готовий взятись за реалізацію.
-
Вітаю, пропоную реалізацію бота на стеку Node.js
із залученням OpenAI API для аналізу контенту.
-
Вітаю вас. Готовий реалізувати такого бота або в n8n або на python. Але все одно ваше ТЗ не достатнє. Потрібно більш деталізувати його. При необхідності можу допомогти зі створення детального ТЗ якщо у вас немає.
-
що означає унікальні? хто визначає унікальність і за якими параметрами? Занадто багато запитань до завдання. Скажіть, що ви на виході хочете отримати.
-
216 Добрий день, готовий реалізувати цей проект, маю досвід у парсингу даних та розробці телеграм ботів.
Пишіть, обговоримо деталі
-
163 Вітаю, готовий реалізувати швидко і якісно, вже маю досвід розробки таких ботів з використанням АІ.
-
271 Вітаю! Я розробник на Python і добре розумію вашу проблему — читати 60 каналів з однаковими новинами неможливо. Я зроблю бота, який перетворить цей хаос на одну чисту та унікальну стрічку.
-
168 Вітаю! Готовий реалізувати для вас функціональний Telegram-агрегатор новин. Маю досвід роботи з бібліотеками Telethon/Pyrogram (для моніторингу каналів) та розробки парсерів для веб-сайтів.
Як вирішу проблему унікальності:
Для того, щоб ви не отримували дублікати новин, я впроваджу систему порівняння контенту за заголовками та змістом (хейшування або векторизація тексту), що дозволить боту "розуміти", що новина вже була, навіть якщо вона написана іншими словами.
Технічний стек:
Python + Aiogram/Pyrogram.
База даних (PostgreSQL або SQLite) для зберігання історії та виключення повторів.
Налаштування сервера (VPS) для роботи бота в режимі 24/7.
-
3385 24 0 Добрий день.
Готовий реалізувати, маю великий досвід у парсингу даних та розробці телеграм ботів
Пишіть, обговоримо деталі
-
667 5 0 Доброго дня! Мене зацікавив ваш проєкт.
Раніше я вже реалізовував аналогічну систему для перехоплення та рерайту новин для власного Telegram-каналу, тому можу розробити рішення у повній відповідності до вашого технічного завдання. Можу також запропонувати підключення зв’язки FuzzyWuzzy + OpenAI для ефективного сортування новин, виявлення дублікатів і автоматичного видалення однакових або схожих матеріалів.
Також маю значний досвід у наступних напрямах:
📊 Обробка даних — робота з базами даних, структурування та аналіз інформації, автоматизація обробки великих обсягів даних, імпорт/експорт і валідація даних.
🤖 Автоматизація та емуляція дій користувача — розробка ботів різної складності, автоматизація рутинних процесів.
⚡️ Асинхронний та багатопотоковий парсинг — збір і обробка даних з оптимізацією продуктивності та швидкості.
… 🔍 OCR та пошук тексту — розпізнавання тексту з зображень та його подальша структуризація.
🖼 Обробка медіа — робота із зображеннями та мультимедійним контентом.
🖥 Розробка програмного забезпечення — створення десктопних застосунків, системних сервісів і служб.
📱 Мобільна розробка — створення нативних і кросплатформених застосунків.
🌐 Робота з API та сторонніми сервісами — інтеграція, автоматизація та обмін даними між системами.
🗣 Переклад і обробка тексту — автоматизація перекладу, робота з мовними моделями та текстовою аналітикою.
🤖 AI/LLM-рішення — впровадження та використання штучного інтелекту, робота з мовними моделями та автоматизація інтелектуальних процесів.
Гарантую якісне та оперативне виконання роботи. Буду радий обговорити деталі проєкту, строки та запропонувати оптимальне рішення — зв’яжіться зі мною!
-
234 3 1 1 Добрий день, готовий зробити вам бота, по ціні домовимось, буду радий до співпраці.
-
2211 18 3 Вітаю! Вже реалізовував схожий проєкт - бот для парсингу Telegram-каналів з автоматичною пересилкою та унікалізацією новин. Готовий швидко адаптувати ці напрацювання під Ваші задачі.
Технічний план реалізації:
- Збір даних: для Telegram - Pyrogram (user-bot) для моментального перехоплення постів. Для сайтів - RSS або кастомні парсери на BeautifulSoup.
- Фільтрація дублікатів (AI): щоб Ви не отримували одну новину з різних джерел, я налаштую порівняння через векторні ембедінги. Це дозволяє ШІ розуміти сенс тексту: якщо три ресурси написали про одну подію різними словами, бот надішле лише перший варіант.
- База даних: використаю Redis для зберігання хешів новин за останні 24-48 годин для швидкої перевірки на копії.
Для оцінки термінів мені потрібно:
…
- Ознайомитися зі списком інтернет-ресурсів (щоб зрозуміти складність скрапінгу).
- Чи потрібно ШІ робити короткий переказ (summary) новини, чи надсилати оригінал?
Готовий обговорити деталі та розпочати, пишіть.
-
159 Готовий взятися!
Можу реалізувати бота на Python, який буде парсити RSS-стрічки ваших сайтів і читати Telegram-канали в реальному часі. Усі новини будуть перевірятися на унікальність перед відправкою — повтори виключені. Задеплою на VPS, бот буде працювати у фоновому режимі 24/7.
Для початку роботи потрібен список сайтів і каналів. Також уточніть — достатньо чи прибирати точні дублікати, або потрібно також відсівати новини, які написані різними словами, але про одне і те ж?
Напишіть у особисті повідомлення або телеграм у моєму резюме, обговоримо деталі!
-
1251 35 1 3 Вітаю, Нікіта, готовий виконати. Пишіть в особисті повідомлення, надсилайте ресурси, обговоримо ТЗ.
-
2138 22 2 привіт
така система буде коштувати від 500 дол.
пишіть, обговоримо
-
249 11 0 2 Добрий день! Ознайомився і Вашим завданням. Наразі маю ревелантний тг бот до того, який Ви бажаєте,але він парсить з 5 сайтів по кожній країні.
Ось можете ознайомитися: @TheGlobalNews_bot(зараз він закритий, за потребою, відкрию).
Пишіть, зроблю швидко та якісно!
На зв’язку!
-
417 2 0 Вітаю
Git-hub
https://github.com/ambarexpressmarket-lab/demo-repo
Портфоліо
Google Drive
-
726 9 1 Доброго дня! Ваш проект викликав у мене великий інтерес. Готовий негайно розпочати роботу та забезпечити високу якість виконання.
-
8753 60 0 1 Вітаю!
Реалізував багато схожих проєктів по написанню тг ботів.
Написав декілька своїх унікальних парсинг інструментів.
Готовий швидко і якісно виконати ваше завдання.
Ознайомтесь з моїм портфоліо.
Пишіть!
Сподіваюсь на плідну співпрацю.
-
208 3 0 Маю досвід в таких завдання, зможу збирати все та інтегрувати ші. Звертайтеся!
-
284 Доброго дня!
Ознайомилась з Вашою ідеєю.
Для реалізації такого бота ключовим є ПАРСЕР НОВИН
Можливо, частина джерел може мати RSS чи відкриті API, але навіть тоді потрібен парсер, який стабільно витягатиме дані й оброблятиме різні формати. Для Telegram‑каналів логіка схожа: є API, але для якісної роботи також потрібен парсер.
Все це зможу зробити в Python + GoLang.
А далі вже можна без проблем об’єднати всі джерела, видалити дублікати й надсилати унікальні новини у ваш Telegram у реальному часі. Зможемо підключити ШІ-моделі. Можливо підійдуть навіть безплатні моделі, можемо також використовувати найновіші OpenAI, Claude, Gemini і т.д.
…
Парсер тут є серцевиною системи — він має вміти працювати з різними джерелами, фільтрувати повтори та забезпечувати швидкість і стабільність. Його потрібно буде ретеально продумати і розмістити на сервері
Кінцева вартість залежить від складності парсера. Чи потрібно налаштовувати обхід Captcha, чи потрібен PlayWright і т.д.
Орієнтовна ставка — $200–600, залежно від того, чи більшість сайтів мають RSS/API, чи потрібен кастомний HTML‑парсинг і додаткові антидетект‑рішення.
Але, можливо що зможемо реалізувати все навіть простіше (тому пишу базову ставку, якщо сам парсер буде простим в реалізації)
Я маю досвід у Python для автоматизації процесів професійної складності (працюю за стандартами Google IT Automation with Python) та інтеграціях із Telegram і API, тому можу запропонувати вам стабільне, масштабоване й професійне рішення.
Пишіть, все обговоримо. Результатом будете задоволені.
-
1423 46 0 Доброго дня, готова виконати завдання. Давайте обговоримо деталі в приватних повідомленнях. Буду рада співпраці!
-
3099 31 0 Вітаю! Можу реалізувати даний проект. Є напрацювання.
Якщо актуально - пишіть, обговоримо.
-
727 6 0 ціна кінцева готовий виконати, звертайтесь
______________________________
-
3387 84 0 Готовий взятися.
Але треба розуміти що користування API ШІ буде коштувати грошей.
Треба бачити ресурсі що б оцінити складність роботи з ними.
Використовую python, uv, github, docker.
-
656 9 0 Доброго дня, Никита!
Загалом завдання зрозуміле, для точної відповіді за термінами та ціною, хотілося б уточнити деякі питання, які у мене виникли після аналізу вашого завдання.
Пишіть у приватні повідомлення – обговоримо деталі та ваші побажання.
-
2496 20 0 Доброго дня, готовий виконати ваше завдання швидко та якісно. маю великий досвід у створенні різноманітних парсерів. Напишіть у особисті повідомлення обговоримо деталі. Залюбки допоможу)
-
1422 13 0 Вітаю.
Можу зробити такого бота. Маю досвід з новинними агрегаторами + AI-фільтрацією.
Як це працюватиме:
- підключення до сайтів (RSS або парсинг) + Telegram-каналів (Telethon)
- збір новин у реальному часі
AI обробка:
- чистка тексту
- визначення дублікатів (semantic + схожість тексту)
… - відправка тільки унікальних новин
Що отримаєте:
- мінімум спаму чи повторів
- швидкі пуші в Telegram
- нормальний читабельний формат
Після списку джерел скажу точну ціну.
-
97 34 4 2 Доброго дня
Готовий виконати
Але є питання що до того, як зрозуміти, що стаття це дублікат
-
834 4 0 Вітаю!
Маю готове рішення для моніторингу новин у реальному часі, яке вже успішно працює. Ви можете переглянути якість збору та ШІ-обробки на прикладі мого діючого проекту: телеграм канал hlamnews2.
Технічна реалізація вашого запиту:
Моніторинг (30 сайтів + 30 каналів): Використовую асинхронний парсинг (Python) для сайтів та UserBot API (Telethon/Pyrogram) для Telegram-каналів. Це забезпечує отримання новини за лічені секунди після виходу.
Інтелектуальний антидубль (AI): Унікальність визначається не просто за збігом тексту, а за допомогою семантичного аналізу (векторні ембеддінги або порівняння через GPT-4o/Gemini). Система розуміє, що різні тексти про одну й ту саму подію — це дублікат, і не пропускає їх.
Інфраструктура: Проект розгортається в Docker, що гарантує стабільність 24/7. Всі процеси логуються, а керування списком джерел виноситься в зручний конфіг або адмін-меню.
-
2409 8 1 Вітаю!
Бачу, що вам потрібен не просто бот для збору новин, а система реального моніторингу з AI-фільтрацією, яка буде відсікати дублікати й надсилати тільки унікальні, корисні новини.
Що можу закрити:
— збір новин у реальному часі з сайтів і Telegram-каналів;
— AI-обробку та антидубль, щоб одна й та сама новина не приходила по кілька разів;
— зручну доставку відібраних новин вам у Telegram.
… Працюю з Python, Telegram-ботами, парсингом, API та AI-обробкою контенту, тому можу зібрати стабільний інструмент, а не просто сирий парсер.
Готовий обговорити джерела й одразу взяти задачу в роботу.
-
4028 11 0 2 Доброго дня. Готовий реалізувати такого Telegram-бота на Python. Є досвід розробки ботів, парсерів, роботи з Telegram API, обробкою новин та логікою дедуплікації даних. Можу зробити систему, яка буде збирати новини в реальному часі з вказаних вами інтернет-ресурсів та Telegram-каналів, аналізувати їх через ІІ та надсилати тільки унікальні події без постійних повторів і дублів.
-
2141 85 0 Готовий зробити. _____________________________________________
-
4975 41 4 1 Доброго дня!
Професійно розробляю ботів у Телеграм на Python. Готовий реалізувати вам парсер новин з унікальною фільтрацією, задіюючи API, веб-скрапінг та бази даних, а також розгорнути його на сервері.
Напишіть мені в лс, уточнимо деталі.
Актуальні фриланс-проєкти в категорії Парсинг даних
Требуется спеціаліст з просування в Telegram.
1286 UAH
Завдання: інвайт реальних користувачів за базою юзернеймів у нові чати та розсилка повідомлень по цільовій базі. Цікавить тільки якісний трафік і робота з живою аудиторією — виконавців, які використовують ботів, накрутку або неякісні методи, прохання НЕ БЕСПОКІТЬ. Робота… Парсинг даних, Просування у соціальних мережах (SMM) ∙ 2 дні 11 годин тому ∙ 8 ставок |
Збір B2B бази даних компаній у Німеччині
1801 UAH
Мета: Отримання списку потенційних роботодавців (клієнтів) для B2B розсилки. Регіон: Мюнхен (München) + радіус 50 км. Вимагані ніші: Будівельні компанії (Bauunternehmen) Продовольчі підприємства (Lebensmittelhersteller, м'ясокомбінати, пекарні) Логістика та складські… Парсинг даних, Продажі та генерація лідів ∙ 2 дні 13 годин тому ∙ 32 ставки |
Консультація по парсингу підписників Instagram-акаунтівДоброго дня. Необхідно провести попередню оцінку можливості виконання наступного завдання. У мене є список Instagram-акаунтів. Мета — отримати контактні дані (в першу чергу email-адреси) користувачів, які підписані на ці акаунти. Раніше мені зустрічалися компанії та сервіси, які… Парсинг даних ∙ 6 днів 6 годин тому ∙ 12 ставок |
Потрібен спеціаліст для пошуку контактів ЛПР по УкраїніНеобхідно зібрати базу (чи готова база) контактів осіб, які приймають рішення (ЛПР), у компаніях України. Збір інформації, Парсинг даних ∙ 6 днів 10 годин тому ∙ 19 ставок |
Потрібно спартити дані з LinkedinПотрібно спартити дані з Linkedin по нашому списку. Для кожного запису потрібно знайти та зібрати доступні дані якщо такі є на Linkedin профілі включаючи фотографію профілю на соц мережі Lihnkedin, email-адресу, посилання на соціальні мережі, вебсайт компанії, номер телефону.… Парсинг даних ∙ 6 днів 16 годин тому ∙ 28 ставок |