Парсер новин
Необходимо создать телеграм бота, который будет отправлять мне все новости в реальном времени из интернет-ресурсов, которые я предоставлю (ориентировочно до 30) и из телеграм-каналов (до 30). Но важно, чтобы он обрабатывал все и отправлял только уникальные новости без повторений много раз.
-
Привет.
Ознакомился с заданием. Могу реализовать для вас бота для мониторинга новостей в реальном времени со сбором данных с сайтов и Telegram-каналов и фильтрацией дубликатов.
С своей стороны могу закрыть:
сбор новостей с до 30 сайтов;
подключение до 30 Telegram-каналов;
…
фильтрацию повторов не только по точному тексту, а и по похожим новостям;
передачу только уникальных сообщений в ваш Telegram;
базовую логику стабильной работы, обработку ошибок и возможность дальнейшего расширения.
Правильный подход здесь — не просто “парсить все подряд”, а собрать стабильный контур мониторинга, где есть:
источники → обработка → проверка на дубликаты → отправка в Telegram.
Именно так система будет пригодна для постоянного использования, а не только как разовый скрипт.
Работаю с Python, Telegram-ботами, парсингом, API и automation-сценариями, поэтому могу собрать это как понятный MVP с нормальной основой для дальнейшего развития.
Срок: 5 дней
Стоимость: 6 500 грн
Готов взяться за реализацию.
-
Здравствуйте, предлагаю реализацию бота на стеке Node.js с привлечением OpenAI API для анализа контента.
-
Здравствуйте. Готов реализовать такого бота либо в n8n, либо на python. Но ваше ТЗ все равно недостаточно. Нужно более детализировать его. При необходимости могу помочь с созданием детального ТЗ, если у вас его нет.
-
что значит уникальные? кто определяет уникальность и по каким параметрам? Слишком много вопросов к задаче. Скажите что вы на выходе хотите получить.
-
216 Добрый день, готов реализовать этот проект, имею опыт в парсинге данных и разработке телеграм-ботов. Пишите, обсудим детали.
-
163 Здравствуйте, готов быстро и качественно реализовать, уже имею опыт разработки таких ботов с использованием ИИ.
-
271 Здравствуйте! Я разработчик на Python и хорошо понимаю вашу проблему — читать 60 каналов с одинаковыми новостями невозможно. Я сделаю бота, который преобразует этот хаос в одну чистую и уникальную ленту.
-
168 Здравствуйте! Готов реализовать для вас функциональный Telegram-агрегатор новостей. Имею опыт работы с библиотеками Telethon/Pyrogram (для мониторинга каналов) и разработки парсеров для веб-сайтов.
Как решу проблему уникальности:
Чтобы вы не получали дубликаты новостей, я внедрю систему сравнения контента по заголовкам и содержимому (хеширование или векторизация текста), что позволит боту "понимать", что новость уже была, даже если она написана другими словами.
Технический стек:
Python + Aiogram/Pyrogram.
База данных (PostgreSQL или SQLite) для хранения истории и исключения повторов.
Настройка сервера (VPS) для работы бота в режиме 24/7.
-
3390 24 0 Добрый день.
Готов реализовать, имею большой опыт в парсинге данных и разработке телеграм-ботов.
Пишите, обсудим детали.
-
667 5 0 Добрый день! Меня заинтересовал ваш проект.
Ранее я уже реализовывал аналогичную систему для перехвата и рерайта новостей для собственного Telegram-канала, поэтому могу разработать решение в полной соответствии с вашим техническим заданием. Могу также предложить подключение связки FuzzyWuzzy + OpenAI для эффективной сортировки новостей, выявления дубликатов и автоматического удаления одинаковых или похожих материалов.
Также имею значительный опыт в следующих направлениях:
📊 Обработка данных — работа с базами данных, структурирование и анализ информации, автоматизация обработки больших объемов данных, импорт/экспорт и валидация данных.
🤖 Автоматизация и эмуляция действий пользователя — разработка ботов различной сложности, автоматизация рутинных процессов.
⚡️ Асинхронный и многопоточный парсинг — сбор и обработка данных с оптимизацией производительности и скорости.
… 🔍 OCR и поиск текста — распознавание текста с изображений и его дальнейшая структуризация.
🖼 Обработка медиа — работа с изображениями и мультимедийным контентом.
🖥 Разработка программного обеспечения — создание десктопных приложений, системных сервисов и служб.
📱 Мобильная разработка — создание нативных и кроссплатформенных приложений.
🌐 Работа с API и сторонними сервисами — интеграция, автоматизация и обмен данными между системами.
🗣 Перевод и обработка текста — автоматизация перевода, работа с языковыми моделями и текстовой аналитикой.
🤖 AI/LLM-решения — внедрение и использование искусственного интеллекта, работа с языковыми моделями и автоматизация интеллектуальных процессов.
Гарантирую качественное и оперативное выполнение работы. Буду рад обсудить детали проекта, сроки и предложить оптимальное решение — свяжитесь со мной!
-
234 3 1 1 Добрий день готов сделать вам бота по цене договоримся буду рад к сотруднечеству
-
2211 18 3 Здравствуйте! Я уже реализовывал похожий проект - бот для парсинга Telegram-каналов с автоматической пересылкой и уникализацией новостей. Готов быстро адаптировать эти наработки под ваши задачи.
Технический план реализации:
- Сбор данных: для Telegram - Pyrogram (user-bot) для моментального перехвата постов. Для сайтов - RSS или кастомные парсеры на BeautifulSoup.
- Фильтрация дубликатов (AI): чтобы вы не получали одну новость из разных источников, я настрою сравнение через векторные эмбеддинги. Это позволяет ИИ понимать смысл текста: если три ресурса написали о одном событии разными словами, бот отправит только первый вариант.
- База данных: использую Redis для хранения хешей новостей за последние 24-48 часов для быстрой проверки на копии.
Для оценки сроков мне нужно:
…
- Ознакомиться со списком интернет-ресурсов (чтобы понять сложность скрапинга).
- Нужно ли ИИ делать короткий пересказ (summary) новости, или отправлять оригинал?
Готов обсудить детали и начать, пишите.
-
159 Готов взяться!
Могу реализовать бота на Python, который будет парсить RSS-ленты ваших сайтов и читать Telegram-каналы в реальном времени. Все новости будут проверяться на уникальность перед отправкой — повторы исключены. Задеплою на VPS, бот будет работать в фоне 24/7.
Для начала работы нужен список сайтов и каналов. Также уточните — достаточно ли убирать точные дубли, или нужно также отсеивать новости, которые написаны разными словами, но об одном и том же?
Напишите в личные сообщения или телеграмм в моем резюме, обсудим детали!
-
1251 35 1 3 Приветствую Никита, готов выполнить.
Пишите в личку, присылайте ресурсы обговорим ТЗ.
-
2138 22 2 привет
такая система будет стоить от 500 долларов.
пишите, обсудим
-
249 11 0 2 Добрый день! Ознакомился с вашим заданием. В настоящее время у меня есть релевантный тг бот к тому, который вы хотите, но он парсит с 5 сайтов по каждой стране. Вот можете ознакомиться: @TheGlobalNews_bot (сейчас он закрыт, при необходимости открою). Пишите, сделаю быстро и качественно! На связи!
-
417 2 0 Привет
Гит-хаб
https://github.com/ambarexpressmarket-lab/demo-repo
Портфолио
Google Drive
-
726 9 1 Здравствуйте! Ваш проект вызвал у меня большой интерес. Готов немедленно начать работу и обеспечить высокое качество выполнения.
-
8753 60 0 1 Здравствуйте!
Я реализовал много похожих проектов по написанию тг ботов.
Написал несколько своих уникальных парсинг инструментов.
Готов быстро и качественно выполнить ваше задание.
Ознакомьтесь с моим портфолио.
Пишите!
Надеюсь на плодотворное сотрудничество.
-
208 3 0 У меня есть опыт в таких заданиях, смогу собирать все и интегрировать ШИ. Обращайтесь!
-
284 Добрый день!
Я ознакомилась с вашей идеей.
Для реализации такого бота ключевым является ПАРСЕР НОВОСТЕЙ. Возможно, часть источников может иметь RSS или открытые API, но даже тогда нужен парсер, который стабильно будет извлекать данные и обрабатывать различные форматы. Для Telegram-каналов логика схожа: есть API, но для качественной работы также нужен парсер. Все это смогу сделать на Python + GoLang.
А дальше уже можно без проблем объединить все источники, удалить дубликаты и отправлять уникальные новости в ваш Telegram в реальном времени. Сможем подключить ИИ-модели. Возможно, подойдут даже бесплатные модели, можем также использовать новейшие OpenAI, Claude, Gemini и т.д.
Парсер здесь является сердцевиной системы — он должен уметь работать с различными источниками, фильтровать повторы и обеспечивать скорость и стабильность. Его нужно будет тщательно продумать и разместить на сервере.
…
Конечная стоимость зависит от сложности парсера. Нужно ли настраивать обход Captcha, нужен ли PlayWright и т.д.
Ориентировочная ставка — $200–600, в зависимости от того, имеют ли большинство сайтов RSS/API, нужен ли кастомный HTML-парсинг и дополнительные антидетект-решения.
Но, возможно, что сможем реализовать все даже проще (поэтому пишу базовую ставку, если сам парсер будет простым в реализации).
Я имею опыт в Python для автоматизации процессов профессиональной сложности (работаю по стандартам Google IT Automation with Python) и интеграциях с Telegram и API, поэтому могу предложить вам стабильное, масштабируемое и профессиональное решение.
Пишите, все обсудим. Результатом будете довольны.
-
1423 46 0 Добрый день, готова выполнить задание. Давайте обсудим детали в личных сообщениях. Буду рада сотрудничеству!
-
3088 31 0 Здравствуйте! Могу реализовать данный проект. Есть наработки.
Если актуально - пишите, обсудим.
-
727 6 0 цена окончательная готов выполнить, обращайтесь
-
3367 84 0 Готов взять на себя.
Но нужно понимать, что использование API ИИ будет стоить денег.
Нужно видеть ресурсы, чтобы оценить сложность работы с ними.
Использую python, uv, github, docker.
-
656 9 0 Добрый день, Никита! В целом задание понятное, для точного ответа по срокам и цене, хотелось бы уточнить некоторые вопросы, которые у меня возникли после анализа вашего задания. Пишите в личные сообщения – обсудим детали и ваши пожелания.
-
2496 20 0 Добрый день, готов выполнить ваше задание быстро и качественно. У меня большой опыт в создании различных парсеров. Напишите в личные сообщения, обсудим детали. С удовольствием помогу)
-
1422 13 0 Здравствуйте.
Я могу сделать такого бота. У меня есть опыт с новостными агрегаторами + AI-фильтрацией.
Как это будет работать:
- подключение к сайтам (RSS или парсинг) + Telegram-каналам (Telethon)
- сбор новостей в реальном времени
AI обработка:
- очистка текста
- определение дубликатов (семантическое + схожесть текста)
… - отправка только уникальных новостей
Что вы получите:
- минимум спама или повторов
- быстрые пуши в Telegram
- нормальный читаемый формат
После списка источников скажу точную цену.
-
97 34 4 2 Добрый день
Готов выполнить
Но есть вопрос относительно того, как понять, что статья является дубликатом
-
834 4 0 Здравствуйте!
У меня есть готовое решение для мониторинга новостей в реальном времени, которое уже успешно работает. Вы можете ознакомиться с качеством сбора и ИИ-обработки на примере моего действующего проекта: телеграм-канала hlamnews2.
Техническая реализация вашего запроса:
Мониторинг (30 сайтов + 30 каналов): Использую асинхронный парсинг (Python) для сайтов и UserBot API (Telethon/Pyrogram) для Telegram-каналов. Это обеспечивает получение новостей за считанные секунды после выхода.
Интеллектуальный антидубликат (ИИ): Уникальность определяется не просто по совпадению текста, а с помощью семантического анализа (векторные эмбеддинги или сравнение через GPT-4o/Gemini). Система понимает, что разные тексты об одном и том же событии — это дубликат, и не пропускает их.
Инфраструктура: Проект разворачивается в Docker, что гарантирует стабильность 24/7. Все процессы логируются, а управление списком источников выносится в удобный конфиг или админ-меню.
-
2409 8 1 Здравствуйте!
Вижу, что вам нужен не просто бот для сбора новостей, а система реального мониторинга с AI-фильтрацией, которая будет отсекать дубликаты и отправлять только уникальные, полезные новости.
Что могу предложить:
— сбор новостей в реальном времени с сайтов и Telegram-каналов;
— AI-обработку и антидубликат, чтобы одна и та же новость не приходила несколько раз;
— удобную доставку отобранных новостей вам в Telegram.
… Работаю с Python, Telegram-ботами, парсингом, API и AI-обработкой контента, поэтому могу собрать стабильный инструмент, а не просто сырой парсер.
Готов обсудить источники и сразу взять задачу в работу.
-
4028 11 0 2 Здравствуйте. Готов реализовать такого Telegram-бота на Python.
Есть опыт разработки ботов, парсеров, работы с Telegram API, обработкой новостей и логикой дедупликации данных. Могу сделать систему, которая будет собирать новости в реальном времени с указанных вами интернет-ресурсов и Telegram-каналов, анализировать их через ИИ и отправлять только уникальные события без постоянных повторов и дублей.
-
2141 85 0 Готов сделать. _____________________________________________
-
4975 41 4 1 Добрый день!
Профессионально разрабатываю ботов в Телеграм на Python. Готов реализовать вам парсер новостей с уникальной фильтрацией, задействуя API, веб-скрапинг и базы данных, а также развернуть его на сервере.
Напишите мне в личные сообщения, уточним детали.
Актуальные фриланс-проекты в категории Парсинг данных
Спарсит телеграмм группы
700 UAH
Нужно спарсить телеграммы группы и отсортировать их по папкам. Необходимы публичные и частные группы. Все, что есть в Польше Парсинг данных, Разработка ботов ∙ 4 часа 18 минут назад ∙ 5 ставок |
Исследование премиум-сегмента КиеваИсследование премиум-сегмента Киева Необходимо провести поиск открытых публичных каналов связи с представителями премиум-сегмента в Киеве. Что нужно собрать: открыто опубликованный email или телефон для связи, если он размещен в публичном источнике. Кого ищем: представители… Парсинг данных, Поиск и сбор информации ∙ 14 часов 22 минуты назад ∙ 11 ставок |
Требуется специалист по продвижению в Telegram.
1286 UAH
Задачи: инвайт реальных пользователей по базе юзернеймов в новые чаты и рассылка сообщений по целевой базе. Интересует только качественный трафик и работа с живой аудиторией — исполнителей, использующих ботов, накрутку или некачественные методы, просьба НЕ БЕСПОКОИТЬ. Работа… Парсинг данных, Продвижение в социальных сетях (SMM) ∙ 3 дня 8 часов назад ∙ 8 ставок |
Сбор B2B базы данных компаний в Германии
1801 UAH
Цель: Получение списка потенциальных работодателей (клиентов) для B2B рассылки. Регион: Мюнхен (München) + радиус 50 км. Требуемые ниши: Строительные компании (Bauunternehmen) Пищевые предприятия (Lebensmittelhersteller, мясокомбинаты, пекарни) Логистика и складские… Парсинг данных, Продажи и генерация лидов ∙ 3 дня 11 часов назад ∙ 34 ставки |
Консультация по парсингу подписчиков Instagram-аккаунтовЗдравствуйте. Необходимо провести предварительную оценку возможности выполнения следующей задачи. У меня есть список Instagram-аккаунтов. Цель — получить контактные данные (в первую очередь email-адреса) пользователей, которые подписаны на эти аккаунты. Ранее мне встречались… Парсинг данных ∙ 7 дней 3 часа назад ∙ 13 ставок |