Бот парсер обьявлений с нужных сайтов по параметрам
1) Общая информация
Название проекта: Бот мониторинга объявлений по заданным параметрам + исключение продавцов (“минус-продавцы”)
Цель: Автоматически находить новые объявления на порталах недвижимости/объявлений по заданным фильтрам и отправлять 1 раз в сутки подборку ссылок в Telegram (обязательно) и опционально в WhatsApp / Email.
Источники (минимум):
Wallapop (
es.wallapop.com)Idealista (
idealista.com)Milanuncios (
milanuncios.com)
Предпочитаемый стек: Python, управление через Telegram-бота, размещение на сервере (VPS).
2) Роли пользователей и права
2.1 Роли
Администратор: полные права (создание/редактирование фильтров, управление продавцами, управление источниками, получателями, расписанием, просмотр логов/статуса).
Оператор (опционально): может управлять фильтрами и продавцами, но без доступа к системным настройкам.
Получатель: получает отчеты, не управляет настройками.
2.2 Авторизация
Доступ к управлению ботом только по списку Telegram user_id (whitelist).
Все команды управления доступны только авторизованным.
3) Функциональные требования
3.1 Мониторинг объявлений
Система должна:
Периодически (по расписанию) проверять новые объявления по заданным фильтрам.
Выявлять и сохранять уникальные объявления, чтобы не присылать повторно.
Уметь исключать объявления по “минус-продавцам” (blacklist sellers) и/или по ключевым признакам (телефон, id продавца, имя/ник, ссылка на профиль — в зависимости от сайта).
Формировать ежедневный дайджест (1 раз в сутки) со списком новых объявлений за период.
3.2 Фильтры (настройки “разделов”)
В интерфейсе Telegram должна быть возможность:
Создать фильтр (называется “Раздел” / “Подборка”).
Для каждого фильтра указать:
Источник: wallapop / idealista / milanuncios (можно несколько)
Параметры поиска (см. 3.3)
Включено/выключено
Получатели (кому отправлять: TG/WA/email)
Частота: по умолчанию 1 раз/сутки (время отправки настраиваемое)
Редактировать фильтр
Удалять фильтр
3.3 Параметры поиска (минимальный набор)
Для каждого источника должны поддерживаться параметры (по возможности ресурса):
Локация (город/регион/провинция, радиус если возможно)
Тип объекта (квартира/дом/комната и т.п. — если применимо)
Цена: min/max
Площадь: min/max (если доступно)
Кол-во комнат: min/max (если доступно)
Ключевые слова включить/исключить (include/exclude)
Доп. параметры: этаж, лифт, новострой/вторичка, состояние и т.п. (опционально)
Сортировка (по дате публикации, newest first — приоритет)
Важно: если ресурс не позволяет часть параметров через URL/поиск, бот должен делать постфильтрацию по полям карточки (если эти поля удается стабильно извлекать).
3.4 “Минус-продавцы” (blacklist)
Нужно уметь:
Добавить продавца в blacklist:
по ссылке на профиль продавца (если есть)
по seller_id (если доступно)
по имени/нику (как запасной вариант)
по телефону/контакту (если публикуется)
Удалить продавца из blacklist
Просмотреть список blacklist
Возможность привязки blacklist:
глобально (для всех фильтров)
и/или локально (только для конкретного фильтра)
3.5 Дедупликация (не слать одно и то же)
Для каждого объявления хранить:
уникальный идентификатор (если есть у сайта) или нормализованный URL
дата первого обнаружения
источник
привязанный фильтр(ы)
статус “отправлено / не отправлено”
(опционально) хэш ключевых полей
Повторная отправка возможна только если администратор явно выберет “переслать”.
3.6 Отчеты и уведомления
Ежедневный отчет (по каждому фильтру или общий):
Заголовок: название фильтра, период, количество новых объявлений
Список объявлений:
ссылка
цена (если удалось извлечь)
локация (если удалось)
краткое описание/заголовок (если удалось)
дата публикации (если доступно)
Формат для Telegram: сообщения + возможно батчинг (например по 10-20 ссылок на сообщение)
Опционально:
Email: письмо (HTML или текст)
WhatsApp: через провайдера (Twilio/360dialog/и т.п.) — уточнить отдельно
3.7 Управление через Telegram (обязательно)
Команды/меню (примерная структура):
/start — приветствие, проверка доступа
“Фильтры”:
список фильтров
создать фильтр (wizard)
редактировать (параметры, получатели, расписание)
включить/выключить
удалить
“Продавцы (blacklist)”:
добавить (ввести ссылку/id/имя)
список
удалить
“Статус”:
состояние парсеров по источникам
дата последнего запуска
кол-во найденных/отфильтрованных/ошибок
“Тест”:
запустить проверку конкретного фильтра вручную (без ожидания суток)
“Настройки”:
время ежедневной отправки
лимиты
выбор каналов доставки
UI предпочтительно через Inline-кнопки и пошаговые диалоги.
4) Технические требования
4.1 Архитектура
Python сервис(ы) на сервере:
Telegram Bot (UI и управление)
Парсеры/воркеры (по расписанию)
Хранилище + логирование
Возможность запуска в Docker (желательно):
docker-compose: bot + worker + db
4.2 Хранилище
Подойдет:
PostgreSQL (предпочтительно) или SQLite (если маленький объем)
Таблицы минимум:
filters
filter_params
sellers_blacklist
listings (объявления)
deliveries (история отправок)
logs/errors
4.3 Планировщик
APScheduler / Celery beat / cron + worker
Расписание:
сбор данных может быть чаще (например каждые 1–3 часа), но отправка — 1 раз в сутки (требование).
-
Здравствуйте. Готов взяться за этот заказ. Задача понятна: реализация python-сервиса с telegram-ботом для управления фильтрами, черным списком продавцов, дедупликацией объявлений и формированием ежедневного дайджеста с Wallapop, Idealista и Milanuncios с развертыванием на VPS. Могу полностью закрыть разработку, настройку и запуск.
-
196 Основные компоненты
Telegram Bot (aiogram)
whitelist по user_id
роли: Admin / Operator / Recipient
меню через inline-кнопки + wizard-диалоги (FSM)
…
Worker-парсер + планировщик
APScheduler (для MVP) или Celery (если хотите масштабирование)
сбор объявлений чаще (каждые 1–3 часа), отправка дайджеста 1 раз/сутки
PostgreSQL
хранение фильтров/параметров
blacklist продавцов (global + per-filter)
дедупликация объявлений и история доставок
Docker-compose
bot + worker + postgres (+ optional redis если Celery)
Источники: как именно парсить
По каждому сайту делаем отдельный модуль-адаптер:
Wallapop: чаще всего проще через выдачу/поиск + карточки, но может меняться разметка/антибот.
Idealista: известен строгим антиботом, иногда требует более “бережного” доступа (задержки, заголовки, прокси), возможны блокировки.
Milanuncios: обычно доступнее, но тоже может троттлить.
Практический подход MVP:
стартуем с парсинга HTML (requests/httpx + lxml/bs4)
аккуратный rate-limit, рандомные задержки, нормальные User-Agent/headers
если какой-то источник начинает “резать”, закладываем опцию переключения на Playwright (дороже по ресурсам)
Дедуп и blacklist — как будет работать
Дедупликация
primary key объявления = site + listing_id (если есть) или нормализованный URL
сохраняем: first_seen, published_at (если достали), title, price, location, url, source
связь “объявление увидено фильтром” через таблицу связей
отправка: только те, что “новые за период” и ещё не доставлены получателям
Минус-продавцы
поддерживаем несколько идентификаторов: seller_profile_url, seller_id, seller_name, phone (если реально доступно)
blacklist бывает:
global
по фильтру
фильтрация делается на этапе обработки карточки объявления
Telegram UI (как будет выглядеть)
Меню:
Фильтры
список
создать (wizard: имя → источники → параметры → получатели → время отправки → включить)
редактировать
включить/выключить
удалить
Blacklist
добавить (вставить ссылку/id/имя/телефон)
список (с пагинацией)
удалить
Статус
последний запуск по источникам
найдено / отфильтровано / ошибок
Тест
ручной запуск фильтра (без ожидания суток)
Настройки
время дайджеста по умолчанию
лимиты сообщений (батч 10–20)
каналы доставки (TG обязательно, Email/WA — опционально)
-
424 1 0 Здравствуйте. Ознакомился с ТЗ — очень профессионально и детально расписано, приятно работать с такой четкой постановкой задачи. Это именно мой профиль. Я специализируюсь на разработке сложных парсеров и Telegram-ботов с админ-панелями. Более того, у меня в портфолио уже есть готовое решение с идентичной архитектурой (система мониторинга цен Steam/OLX), которое я могу адаптировать под ваши потребности. Почему я справлюсь лучше других: Готовая архитектура: Я уже работаю с связкой Python + Aiogram + PostgreSQL + Docker. У меня реализована логика "воркеров", очередей задач (Redis/Celery) и фильтрации дублей. Это именно то, что вы описали в технических требованиях (docker-compose: bot + worker + db). Опыт с защитой: Wallapop и Idealista имеют серьезную защиту от ботов (Cloudflare/Datadome). Обычные запросы там не работают. Я умею обходить это через эмуляцию браузера (Playwright/Selenium) и ротацию User-Agents/Proxy. Админка: Реализую управление фильтрами и "минус-продавцами" через удобное меню с Inline-кнопками, как в моих предыдущих проектах. Мой план реализации: Развертывание БД (PostgreSQL) для хранения объявлений и черных списков. Написание парсеров для каждого источника (Idealista, Wallapop, Milanuncios). Настройка планировщика (Scheduler) для сбора данных и отправки отчетов раз в сутки. Готов показать примеры кода и архитектуру своих ботов. Уверен, что смогу реализовать этот проект качественно и стабильно.
-
358 1 0 Добрый день!
Я специализируюсь на Python-разработке, автоматизации процессов и создании Telegram-ботов. Ваше техническое задание понятно: парсинг объявлений с Wallapop, Idealista и Milanuncios, фильтры с параметрами поиска, система "минус-продавцов", дедупликация и ежедневные дайджесты в Telegram.
Могу реализовать архитектуру на Python с базой данных (PostgreSQL), планировщиком и Docker-деплоем. Готов обсудить детали и сроки выполнения.
-
172 1 1 Добрый день! Готов выполнить данный проект есть большой опыт разработки различных приложений.
-
310 Добрый день!
Ознакомился с техническим заданием по разработке бота мониторинга объявлений (Wallapop / Idealista / Milanuncios) с управлением через Telegram. Проект хорошо структурирован, требования четкие — это именно тот тип задач, с которыми я регулярно работаю.
Мой опыт и подход полностью соответствуют заявленным требованиям:
Технологии и стек
Python (async / sync, в зависимости от источника)
…
Парсинг: requests + BeautifulSoup / Playwright (где нужен JS)
Telegram Bot API (aiogram / pyTelegramBotAPI)
PostgreSQL (структурированная модель данных под фильтры, объявления, blacklist, deliveries)
APScheduler / Celery beat для расписаний
Docker / docker-compose
VPS-деплой (Linux)
Архитектура
Разделение на сервисы: Telegram-бот (UI) + воркеры-парсеры
Плагинная структура источников (каждый сайт — отдельный модуль)
Дедупликация по ID / normalized URL + хеш ключевых полей
Поддержка глобального и локального blacklist продавцов
Постфильтрация данных, если часть параметров недоступна через URL
Функциональность
Wizard-создание фильтров через Telegram (inline-кнопки, пошаговые диалоги)
Гибкие фильтры (цена, локация, ключевые слова, параметры объекта)
Ежедневный дайджест с батчингом сообщений
Ручной запуск проверки фильтра
Логи, статусы источников, обработка ошибок
Whitelist авторизация по Telegram user_id
Дополнительно
Оптимизация под low-latency и стабильность
Возможность дальнейшего подключения Email / WhatsApp (через провайдера)
Готовность документировать структуру и передать проект на поддержку
Могу взять на себя:
полную реализацию проекта под ключ
или отдельные части (парсеры, Telegram UI, архитектура, деплой)
Готов обсудить детали: объем MVP, сроки, формат сотрудничества и бюджет.
Спасибо за внимание — буду рад обратной связи.
-
736 10 0 Здравствуйте, все это реально разработать, я готов, просто нейронка, которая писала это ТЗ, за пару штук баксов здесь написала twillo как минимум)) Что касается интеграции с WhatsApp, вы должны знать, что это дополнительные расходы ≈10$ в месяц, если использовать неофициальное АПИ, если официальное, цена варьируется в пределах 500$ за 5000 сообщений.
-
1017 2 1 Приветствую! Ознакомился с ТЗ. Задача ясна: нужен стабильный мониторинг площадок с агрессивной анти-фрод защитой (Idealista, Wallapop, Milanuncios).
Имею большой опыт работы с Playwright и обходом систем защиты уровня DataDome/Cloudflare. Для реализации проекта предлагаю следующий стек:
Парсинг: Playwright (Chromium-Ghost / Stealth-патчи) для полной имитации поведения реального пользователя. Это позволит обходить проверки на автоматизацию.
Анти-бан: Настройка ротации резидентных прокси и генерация уникальных фингерпринтов для каждого сеанса.
Backend: Python (Aiogram 3.x) для управления через Telegram.
…
База данных: PostgreSQL для надежного хранения объявлений, истории дедупликации и черного списка продавцов.
Архитектура: Docker-compose для удобного развертывания на VPS, планировщик задач (APScheduler) для гибкой настройки частоты проверок и рассылки дайджестов.
Реализую весь функционал: пошаговый конструктор фильтров в TG, глобальный и локальный blacklist продавцов, дедупликацию по ID/URL и ежедневные отчеты.
Готов обсудить детали: какие именно лимиты по количеству запросов планируются и требуется ли интеграция с платными сервисами решения капчи (на случай их появления).
Пишите в личные сообщения, обсудим архитектуру и сроки!
-
1101 7 1 Привет!
У меня есть опыт создания ботов для мониторинга и парсинга данных, недавно реализовал похожего бота для автоматического сбора объявлений с сайтов недвижимости с интеграцией Telegram.
Сделаю бот-парсер на Python с использованием библиотек для парсинга данных (таких как BeautifulSoup или Scrapy) и aiogram для управления через Telegram. Реализую систему фильтров, черный список продавцов, а также формирование ежедневного дайджеста с новыми объявлениями.
Это обеспечит удобный доступ к актуальным объявлениям без повторений и возможность настройки под специфические потребности. Давайте обсудим детали!
-
Добрый день!
Могу разработать Python-бота для автоматического сбора объявлений с Wallapop, Idealista и Milanuncios с нужными параметрами и функцией "минус-продавцы". Бот будет управляемым через Telegram, с полным управлением фильтрами, черным списком, получателями и расписанием отправки.
Что будет сделано:
Парсинг новых объявлений по заданным фильтрам;
Дедупликация и избегание повторных отправок;
… Исключение "минус-продавцов" по ID, нику, контакту или ссылке;
Формирование ежедневного дайджеста (Telegram, опционально WhatsApp/Email);
Управление через Telegram-бота с ролями: Админ, Оператор, Получатель;
Гибкие фильтры: локация, тип, цена, площадь, количество комнат, ключевые слова, дополнительные параметры;
Хранение данных в PostgreSQL (или SQLite при небольшом объеме), логирование ошибок, история отправок;
Возможность запуска через Docker;
Планирование: парсинг 1–3 раза в день, отправка 1 раз в сутки.
Гарантирую корректность сбора данных, стабильную работу и возможность дальнейшего масштабирования/добавления новых источников.
Стоимость 35 000, платежная система фриланса не позволяет ставить ставку выше 27 000, поэтому ставлю 27 000, проект можно разделить на 2.
-
2964 14 0 Добрый день.
Проект понятен по логике и объему. Для части источников стоит сразу проверить наличие официальных или полуофициальных API или стабильных JSON endpoint, если они есть, это будет надежнее и безопаснее, чем классический парсинг HTML. Там где API недоступно, можно использовать парсеры с постфильтрацией данных из карточек объявлений.
Могу предложить реализацию не только на Python, но и на Node.js с Typescript. Такой стек хорошо подходит для Telegram-ботов, фоновых воркеров, планировщиков и масштабирования, плюс удобно работать с PostgreSQL и очередями. Управление через Telegram, роли, whitelist, фильтры, blacklist продавцов, дедупликация и ежедневные дайджесты без проблем укладываются в эту архитектуру. Размещение на VPS, изоляция через Docker Compose, отдельные сервисы для бота, воркеров и базы данных.
Отправку в Telegram реализую обязательно, Email и WhatsApp можно подключить опционально через провайдера. В интерфейсе Telegram можно сделать пошаговые диалоги и inline-кнопки для удобного управления фильтрами, продавцами и расписанием. Сроки и стоимость предлагаю обсудить в личных сообщениях после уточнения приоритетов по источникам и каналам доставки.
-
1993 12 0 Добрый день
У меня большой опыт разработки ботов и парсинга, разрабатывал похожие проекты
Напишите мне
-
747 2 0 Спасибо за подробное ТЗ, ознакомился.
В целом требования понятны: бот мониторинга объявлений с дедупликацией, blacklist продавцов, гибкими фильтрами и управлением через Telegram, с ежедневной отправкой дайджеста. Архитектура и стек (Python, TG-бот, VPS, Docker, PostgreSQL) мне подходят.
Готов реализовать рабочее решение на базе MVP либо переработать текущую реализацию, если она нестабильна.
Для точной оценки сроков и стоимости нужно:
1. посмотреть текущее MVP (репозиторий / описание архитектуры);
2. понять, какие источники уже реализованы и в каком состоянии парсеры;
… 3. уточнить приоритеты (обязательный минимум на первый этап).
После этого смогу предложить:
этапы реализации,
реалистичные сроки,
стоимость по этапам.
Готов обсудить детали и начать с аудита текущего решения.
-
122 Добрый день! 👋
Интересен ваш проект Telegram-бота-парсера для сбора новых объявлений.
У меня есть опыт разработки Python-скриптов с парсингом, обработкой данных и Telegram-ботов, которые отправляют сообщения в чат.
Чтобы точно оценить сроки и стоимость, уточните, пожалуйста:
1) с каких именно сайтов нужно парсить объявления?
2) нужны ли фильтры по категориям/цене/региону?
3) как часто мы должны проверять сайт на новые объявления?
… 4) нужно ли сохранять историю / избегать дублирования через базу данных?
После уточнения дам предложение по срокам и цене.
-
324 Здравствуйте.
Я уже разрабатывал подобную архитектуру для аналитики Steam — там как раз использовал воркеры для сбора данных, очереди и сложную фильтрацию. Поэтому вашу задачу понимаю отлично и знаю, как реализовать это стабильно.
-
95644 1272 1 10 Здравствуйте.Есть большой опыт в разработке телеграм ботов.Готов к сотрудничеству
-
1803 31 0 Здравствуйте, готов разработать
Напишите в лс для обсуждения деталей
Актуальные фриланс-проекты в категории Python
Телеграм-бот для найма/поиска работников. Для поиска работы
1100 UAH
1. Общая концепция Создание Telegram-бота для автоматизации подбора персонала и двустороннего поиска работы. Система работает по принципу активного отклика и взаимного подтверждения интереса (Double Opt-In). В системе предусмотрены две роли: Работодатель (Владелец фирмы) и… Python, Разработка ботов ∙ 11 часов 57 минут назад ∙ 63 ставки |
Техническая поддержка веб-платформы (Python/Django)Есть работающий веб-проект, нужно поддерживать и постепенно приводить в порядок, без переписывания с нуля. Стек проекта: Backend: Python, Django, Django Rest Framework Frontend: Next.js База данных: PostgreSQL Инфраструктура: AWS (EC2), Nginx Есть интеграции с внешними API… Python, Веб-программирование ∙ 14 часов 6 минут назад ∙ 52 ставки |
Разработка веб-сервиса с платным доступом к онлайн-чатуДобрый день, необходимо разработать веб-сервис, который включает: * персональные ссылки для пользователей; * страницу с описанием услуги; * оплату через PayPal; * онлайн-чат в реальном времени; * отображение видео на странице пользователя; * учет оплаченного времени и… Python, Веб-программирование ∙ 1 день 15 часов назад ∙ 70 ставок |
Создание приложенияЖелаю создать мобильное приложение для общения, в приложении должны быть аудио, видео звонок, создание групповых чатов, возможность синхронизировать с контактами телефона, настройками аккаунта: привязка по email, 2fa, номеру телефона, возможность настраивать уведомления… Java, Python ∙ 2 дня 13 часов назад ∙ 36 ставок |
Настройка двусторонней интеграции WhatsApp с Odoo CRMЗдравствуйте! Ищем специалиста для реализации технического задания по настройке двусторонней интеграции мессенджера WhatsApp с CRM-системой Odoo. ⚠️ Важное техническое уточнение: Официальный WhatsApp Business API (WABA) не рассматривается. Необходимо внедрить стабильное «серое»… Python, Веб-программирование ∙ 2 дня 23 часа назад ∙ 23 ставки |