Парсер, фильтрация результатов, база данных и сервер (часть 1)
16 500 UAHЗадание
Реализованный образец чат-бота homebro_rent_bot
Для выполнение работы можно взять в примеры такие парсеры:
https://github.com/HugoJBello/python-datascraping-fotocasa-idealista - приоритет
https://github.com/ramonmv04/fotocasa
https://github.com/brincowale/search-rooms
https://github.com/ethancarlsson/Idealista-WebScraper
Парсер должен работать с такими источниками:
https://www.pisocompartido.com
Предусмотреть дальнейшее добавление других источников.
Требуемые данные:
загрузка информации об объектах жилой недвижимости в аренду (комнаты, квартиры) - детально смотрите ниже;
найденная парсером информация должна сохраняться на сервере;
предусмотреть выполнение смены ip адресов во время загрузки для избежания блокировок со стороны сайтов;
предусмотреть обход капчи, пример как это реализовано: https://github.com/ethancarlsson/Idealista-WebScraper
один и тот же объект недвижимости должен сохраняться один раз, если объект встречается повторно, прописывать признак дубликата позже опубликованному (требуется обсуждение). При этом не загружать пользователю дубликат;
сохранить признаки или теги “можно с животными” и “курящие”;
сохранить признак для комнат, какой пол человека ищут, либо ищут пару.
выгружать адреса объекта недвижимости который на сайте представлен в качестве зоны на GoogleMaps, либо в качестве теста (адрес также может содержаться в описании объекта) и сохранить его в качестве ссылки на google maps
создать клиентскую страницу или google form с возможностью добавить информацию об объекте вручную, либо предусмотреть добавление нового объекта в базу данных через bot (приоритет)
предусмотреть подключение дополнительных зон для загрузки (следующий район, следующий город, автономия);
предусмотреть автоматическое удаление данных через определенный период времени;
перепроверка актуальности объектов, если объект уже сдан или отсутствует, то не показывать его пользователю
Построчное описание данных на примере сайта idealista.com
идентификатор
название
фото
район
стоимость
описание
количество комнат
количество ванных комнат
квадратура
этаж
удобства как на скрине
дополнительные фотографии
наименование агентства и контакты (если есть)
признак собственник или нет
Выгрузка и настройка
предусмотреть постепенное подключение дополнительных зон для загрузки (следующий район, следующий город, автономия);
должен быть предусмотрен удобный доступ к результатам работы парсера с целью запуска в документах Google или иных программах для предварительного анализа данных.
Сортировка результатов
Сортировка результатов будет осуществляться согласно запросу клиента из чат-бота.
Основные данные для настройки
бюджет
комната, квартира, и то и то
в случае комнат (разрешено ли для пары, с детьми, с домашними животными) комнаты для мужчин, комнаты для женщин
количество комнат
от собственника или агентства
заны транспорта (1, 2 …. 6)
линии метро или поезда
расстояние до метро или поезда
станции метро или поезда
район города
сортировка квартир или комнат по параметру с мебелью или нет (задача для нейросети)
с гаражом или без
настройки фильтрации и сортировки должны сохраняться в базе данных для пользователей. Также нужно сохранять информацию о пользователях.
Уже отсортированная информация, согласно настройкам пользователя, должна быть доступна для запроса со стороны сервера, также если произошли изменения. Т.е если появились новые варианты недвижимости (квартиры, комнаты), то новые данные должны попасть в выборку и должны быть загружены чат-ботом, если пользователь еще не остановил работу бота.
Дополнительно
использовать перевод на другой язык контента объекта “на лету”
Требование к серверу
сервер должен предусматривать большую нагрузку со стороны запросов пользователей чат-бота (запрос ведущий к сортировке данных или запрос на получения информации из базы)
настройка прав доступа: пользователь, администратор и разработчик
база данных должна быть переведена в пользование заказчика.
административные доступы должны быть переданы заказчику
Отзыв заказчика о сотрудничестве с фрилансером
Парсер, фильтрация результатов, база данных и сервер (часть 1)Константин прекрасно выполнил поставленную задачу. Проект был поделен на две части. Первая часть это сервер, парсер, база данных, вторая часть - бот и дополнительные моменты.
Константин не раз инициативно предлагал более изящное и правильное решение сложных этапов задачи и при этом работал совершенно автономно. При этом контакт с ним я всегда могу поддерживать.
Работой Константина очень доволен. Приступаем ко второй части задания.
Отзыв фрилансера о сотрудничестве с Алексеем Николаенко
Парсер, фильтрация результатов, база данных и сервер (часть 1)Отличный заказчик. Хорошо проработанное тз, приятный в общении, интересный проект
Очень доволен сотрудничеством
![]()
-
291 3 0 Добрый день! Я менеджер компании Groot soft. Мы занимаемся разработкой ботов уже более 3-ох лет. Наша команда профессионалов сделает все качественно и в установленные сроки.
Для более детального общения ждём вас в личных сообщениях
-
241 Добрый день. Задание интересное и нестандартное. Я являюсь Python разработчиком уже 2 года и работаю непосредственно специалистом по Парсингу данных. Задача объективно не на два дня. Сроки указаны примерно. ТЗ написано более чем понятно, но ясно пару нюансов, которые нужно обсудить. Если вас заинтересовала моя кандидатура, то буду рад сотрудничество
Актуальные фриланс-проекты в категории Python
Улучшение макроса
702 UAH
Необходимо улучшить уже существующий макрос. Сам макрос, возможно, простой, не знаю, потому что мне его передал предыдущий сотрудник. Используется макрос для создания спецификаций. Так как я работаю в розничной торговле, то для каждой операции с поставщиком, а именно поставками,… Python ∙ 5 часов 42 минуты назад ∙ 11 ставок |
Создание Тик-ток фермы с генерацией дохода
27 000 UAH
в поиске человека, который может написать софт, для фермы тик ток, чтобы мы смогли генерировать трафик, получать доход. Ищем готовое решение с полным циклом. Python, Разработка ботов ∙ 1 день 6 часов назад ∙ 15 ставок |
AI Commenting Platform для TikTok и Instagram.Цель проекта Разработать систему, которая позволяет управлять большим количеством аккаунтов TikTok и Instagram и автоматически публиковать релевантные комментарии под выбранными видео с использованием ИИ. Основной функционал1. Управление аккаунтами Необходимо реализовать… AI и машинное обучение, Python ∙ 2 дня 13 часов назад ∙ 22 ставки |
Построить модель классификации клиентов1. Есть данные клиентов в Mongo/SQL (примерно 20 000 записей с сырыми данными). 2. Необходимо на их основе построить фичи и модель классификации клиентов на поведенческие группы. 3. Проект выполнить на Python. AI и машинное обучение, Python ∙ 4 дня 7 часов назад ∙ 43 ставки |
ИТ Автоматизация ведения VAT-отчетности
10 000 UAH
Необходимо разработать систему для автоматизации переноса данных о продажах из CRM в бухгалтерскую систему Wafeq. Система должна импортировать банковские и платежные отчеты, автоматически сверять платежи с инвойсами, формировать инвойсы для VAT-отчетности и минимизировать ручную… AI и машинное обучение, Python ∙ 4 дня 12 часов назад ∙ 51 ставка |
