Общая геопространственная база данных
Создать геопространственную базу данных, объединяющую несколько публичных источников (DVF, ADEME, Cadastre, BAN и т.д.) для идентификации и сопоставления объектов недвижимости даже при частичных или приблизительных данных (координаты, описания или фотографии улицы).
Область работ:
Сбор и нормализация данных:
DVF (история продаж)
Cadastre (геометрия, кадастровые участки)
BAN (национальный реестр адресов)
ADEME (энергетические данные / DPE)
Онлайн-объявления (архив 1–2 года)
Mapillary / Google Street (геотегированные уличные и фасадные фото)
Задача: построить единое хранилище, связывающее участки (parcelles), здания и адреса.
Реализовать:
пространственные соединения (spatial joins) и нечёткое (fuzzy) сопоставление адресов/координат;
чистый и удобный API для внутреннего использования (FastAPI или GraphQL).
Финальные кейсы использования для объединённой БД
Полное объявление → точный кандидат на здание
Вход: полное онлайн-объявление с текстом (например: «2-комнатная, 55 м², балкон, вид на Сакре-Кёр, рядом метро Abbesses») + фотографии (включая вид из окна).
Процесс:извлечение примерного адреса/ориентиров из описания (NLP);
совпадение GPS из метаданных фото (если есть);
сверка фото вида с геотегированной фотобазой (Mapillary, Google Street View);
сужение списка зданий по кадастровым полигонам.
обогащение данными ADEME (энергетика, год постройки) и DVF (история сделок).
Выход: ранжированный список кандидатов со значениями ban_id, id_parcelle, адресом и скором доверия.
Приблизительные координаты + текст объявления → лучшие совпадения
Вход: объявление с GPS, но с погрешностью ±300 м.
Процесс:найти все участки/здания внутри буферной зоны;
отфильтровать по характеристикам объявления (этаж, площадь, количество комнат, наличие балкона, год постройки) используя DVF + ADEME + атрибуты кадастра.
Выход: шортлист вероятных адресов с вероятностями.
Кросс-поиск по историческим объявлениям
Вход: текущее объявление «лофт 90 м², Marais, Paris».
Процесс:сопоставление с архивом объявлений;
проверка, не появлялся ли объект ранее с точным адресом;
валидация консистентности (площадь, цена, фото).
Выход: возможное точное совпадение с ID здания и историей цен.
Распознавание вида из окна
Вход: фото из окна с видом на Эйфелеву башню.
Процесс:определение ориентации и узнаваемых ориентиров на изображении;
кросс-проверка с геопространственными данными (какие здания имеют такую линию видимости);
учёт этажа/высоты из кадастра/INSEE.
Выход: список кандидатов зданий, соответствующих перспективе.
Детекция подозрительных / мошеннических объявлений
Вход: объявление заявляет «30 м², €70,000, рядом Gare de Lyon».
Процесс:сверка с DVF по зданиям в этом районе;
сравнение заявленной площади с кадастровыми записями;
обнаружение аномалий цены.
Выход: флаг «Нереалистичная цена, возможное мошенничество».
Идентификация без адреса
Вход: объявление только с описанием: «Студия 18 м², рядом Place d’Italie, тихая улица, 5-й этаж, постройка 1970-х».
Процесс:NLP извлекает район и примерный год постройки;
фильтрация BAN + ADEME для зданий в 13-м округе, построенных ~1970;
применение фильтра по площади на основе DVF.
Выход: набор из 2–3 кандидатов с оценками доверия.
Мульти-источникное обогащение
Вход: адрес или обнаруженный ID здания.
Процесс: связать все базы (DVF, ADEME DPE, кадастр, нормализованный BAN, исторические объявления).
Выход: единая карточка объекта с консолидированными атрибутами (история транзакций, энергопоказатели, геометрия здания, геотегированные фото).
✅ Ожидания от Data Engineer:
Построить нормализованное хранилище данных (BAN + DVF + ADEME + cadastre + фотографии).
Реализовать пайплайны сопоставления (spatial join, fuzzy text matching, проверка фото по гео).
Предоставить API, принимающий сырые входы (текст объявления, координаты, фото) и возвращающий ранжированные кандидаты адресов/зданий.
-
1 день50 920 UAH1 день50 920 UAH
Привет, я работал над **геопросторовой базой данных️** - обработал 5 источников, 3000+ объектов, интегрировал API для поиска ответа на местоположение.
Как вы планируете реализовать нечеткое сопоставление адресов для повышения точности?
Предлагаю связаться, я бесплатно проконсультирую вас с технической стороны и составим план разработки + расскажу о моей команде!
-
60 дней178 220 UAH
1470 6 0 1 60 дней178 220 UAHЗдравствуйте! 👋
У меня есть солидный опыт в создании геопространственных систем данных, ETL-пайплайнов и алгоритмов нечеткого сопоставления для аналитики недвижимости и городского планирования. Ваш проект fascinates — объединение DVF, ADEME, Кадастра, BAN и фотоданных в единую геопространственную базу знаний для идентификации объектов недвижимости.
📌 Вот что я могу предложить:
• Создать нормализованный хранилище данных PostGIS, гармонизируя ключи между DVF, BAN, ADEME и кадастровыми данными.
• Реализовать пайплайны сопоставления: пространственные соединения, нечеткое сопоставление адресов, EXIF-геоизвлечение и парсинг текста с использованием NLP (spaCy / transformers).
• Интегрировать обогащение данных из ADEME, DVF, Mapillary/StreetView и исторических списков.
• Предоставить чистую точку доступа FastAPI (или GraphQL), которая принимает текст, координаты или фотографии и возвращает ранжированные кандидаты на объекты недвижимости (ban_id, id_parcelle, оценка уверенности).
… • Добавить уровень качества данных: журналы, обнаружение аномалий (цена, площадь, дубликаты) и статистику сопоставления.
🧠 Стек: Python (pandas, GeoPandas, shapely, scikit-learn, OpenCV), PostgreSQL + PostGIS, FastAPI, Airflow, Docker.
⏱ Сроки: 6–8 недель для MVP (хранилище данных + API).
💰 Бюджет: от $3,500 — в зависимости от объема данных и необходимой глубины автоматизации.
Я буду рад обсудить архитектуру данных и показать концептуальную демонстрацию интеграции BAN + DVF + Кадастр.
-
1 день1273 UAH
162 1 день1273 UAHЗдравствуйте.
С интересом ознакомилась с Вашим проектом. Уверена что смогу сделать эффективную и качественную работу соответствующее Вашим требованиям и ожиданиям. Опыт работы более 8 лет. Готова обсудить детали и приступить к работе. Жду Вашего ответа.
Актуальные фриланс-проекты в категории Python
Подключить форму на лендинге к keycrmНеобходимо подключить форму заявки на лендинге к keycrm. Все необходимые доступы предоставлю. Пишите, сколько времени и средств займет такая задача. HTML и CSS верстка, Python ∙ 4 часа 59 минут назад ∙ 63 ставки |
Разработка программного обеспечения для управления iPhone через USB-кабель с ПК
10 000 UAH
Необходимо разработать программу для Windows, которая позволяет подключать iPhone с jailbreak через USB-кабель и управлять им с компьютера. Основной функционал: Подключение iPhone через USB. Программа должна быстро распознавать подключенный iPhone и работать через кабель,… C и C++, Python ∙ 1 день 21 час назад ∙ 17 ставок |
BuzzPost автоматизация Facebook под ИзраильПроект уже есть и он работает - задача решить вопрос по ограничению фб, при количестве постов в час более 3-4 (с 7 утра до 12 ночи) аккаунты клиентов ограничиваются фб. сайт - https://buzzpost.co.il/ Также поискать дыры в логике и в самом проекте и поправить их, опять же логика… Python, Работа с клиентами ∙ 2 дня 18 часов назад ∙ 15 ставок |
AI Commenting Platform для TikTok и Instagram.Цель проекта Разработать систему, которая позволяет управлять большим количеством аккаунтов TikTok и Instagram и автоматически публиковать релевантные комментарии под выбранными видео с использованием ИИ. Основной функционал1. Управление аккаунтами Необходимо реализовать… AI и машинное обучение, Python ∙ 6 дней 20 часов назад ∙ 23 ставки |
Построить модель классификации клиентов1. Есть данные клиентов в Mongo/SQL (примерно 20 000 записей с сырыми данными). 2. Необходимо на их основе построить фичи и модель классификации клиентов на поведенческие группы. 3. Проект выполнить на Python. AI и машинное обучение, Python ∙ 8 дней 14 часов назад ∙ 48 ставок |