Парсинг архитектурных фотографий
Задача:
Собрать фотографии с двух сайтов - ArchDaily (archdaily.com) и Architectural Digest (architecturaldigest.com)
Загрузить фото в максимально доступном качестве.
Распределить фотографии по отдельным папкам: Exterior (экстерьер) Interior (интерьер) Exterior Top View (вид сверху)
По возможности избежать дубликатов. Передать результат через Google Drive или в архивированном виде.
-
Добрый день. Могу выполнить, хотелось бы получить более подробное ТЗ.
-
Могу выполнить в течение 1 дня, фото будут в максимально доступном качестве, при необходимости могу их еще обработать, например, перевести в нужный формат. Единственный вопрос - как их сортировать по папкам? На ArchDaily вижу отдельные фильтры по Exterior и Interior, но не вижу Exterior Top View - это нужно вручную делать после парсинга? Или я просто не увидел нужного раздела?
-
6256 74 1 Могу сделать быстро и качественно. Нужно более детально обсудить. Буду рад сотрудничеству.
-
172 1 1 Добрый день. Готов выполнить данный проект, имею большой опыт разработки приложений.
-
702 1 0 Здравствуйте! Готов к сотрудничеству. Предлагаю качественную и быструю работу. Пишите.
-
2663 41 2 1 Спарсить не проблема, но для группировки понадобятся траты на ши для анализа и распределения...
-
315 Здравствуйте, готов выполнить сбор архитектурных фотографий с ArchDaily и Architectural Digest. Планирую сделать Python-скрипт для сбора и загрузки изображений в максимально доступном качестве, разложить фото по папкам Exterior / Interior / Exterior Top View и убрать дубликаты по URL и hash файла.
Перед началом хотел бы уточнить:
- Какой нужен приблизительный объем фото;
- Собирать с всего сайта или по конкретным разделам/ссылкам;
- Допустима ли наполовину автоматическая проверка для категории Exterior Top View, так как она всегда явно выделена на сайтах.
Результат передам архивом или через Google Drive.
-
3880 15 0 Добрый день.
У меня большой опыт в выгрузке фото с сайтов, построении зеркал.
На первый взгляд задача кажется простой: взять два сайта и скачать фото.
Но ArchDaily - это база проектов, их там более 30000+, не включая статьи, новости.
Architectural Digest - это журнал, как таковых проектов там нет, но есть статья-галерея, например (туры по домам как пример).
Почему не все так легко, как кажется?
1. Скачать и собрать - да, это просто. Скачать 1 миллион фото - это под терабайт данных, и сайт, скорее всего, если это не организовать в пайплайне, заблокирует через несколько часов.
2. Разложить по папкам - это означает, при условии скачать все, просмотреть каждую фотку и понять, что на ней.
То есть вопрос:
… действительно ли нужно скачивать все?
по каким-то фильтрам, дате, количеству проектов/статей?
от этого очень зависит конечная стоимость, если точечно, то это значительно дешевле, если все с классификацией, то это будет значительно дороже.
-
5097 37 2 Доброго дня! Задание понятное. Выполню автоматический парсинг фотографий с обоих сайтов в максимальном доступном качестве, распределю по папкам Exterior / Interior / Exterior Top View и отфильтрую дубликаты. Результат передам через Google Drive. Готов обсудить детали и сроки.
-
1825 52 0 Добрый день. Могу собрать все фотографии с этих сайтов. Только проблема будет, как их различать по отдельным папкам. Нужно будет написать нейросеть - чтобы различала их. На втором сайте не известно, откуда именно брать картинки - можно с всего сайта через sitemap - но неизвестно, сколько их там.
40 дней / 40000 грн
-
3099 31 0 Привет! Со своей стороны реализую быстрый и стабильный асинхронный парсер на Python. Загружу фото в максимальном разрешении, настрою механизм дедупликации (по хешам файлов), чтобы избежать повторов, и организую автоматическую выгрузку структурированного архива на Google Drive.
Что касается сортировки по папкам (Exterior/Interior/Top View): если сайты не имеют точных тегов, я подключу легкую модель классификации изображений, чтобы автоматизировать этот процесс. Давайте обсудим детали в приватных сообщениях!
-
321 Здравствуйте. Могу собрать архитектурные фотографии с ArchDaily и Architectural Digest, загрузить их в максимально доступном качестве, разложить по папкам Exterior / Interior / Exterior Top View и убрать дубликаты по URL и hash файла.
План работы:
1. Уточняю необходимый объем: количество фото, категории или список страниц/ссылок.
2. Пишу Python-скрипт для сбора ссылок и загрузки изображений.
3. Сохраняю фото в отдельные папки по категориям.
4. Проверяю дубликаты.
5. Передаю результат архивом или через Google Drive.
…
Важное уточнение: для Exterior Top View может понадобиться ручная или полуавтоматическая проверка, так как такая категория не всегда является отдельным фильтром на сайте.
Ориентировочно: 4000 грн, 4 дня. Точную оценку подтвержу после уточнения количества фото и правил сортировки.
-
3392 84 0 Готов взять. Но какие примерно объемы парсинга? Нужно уточнить детали заказа, пишите! Использую python, uv, github, docker.
-
622 13 0 Добрый день, напишу скрипт и быстро выполню ваше задание, опыт имею.
-
1490 28 0 Готов выполнить ваше задание, пишите для обсуждения подробностей
-
690 5 1 Привет, пиши в личку, обсудим детали, выполню быстро, довольно легкое задание
-
726 9 1 Здравствуйте! Ваш проект вызвал у меня большой интерес. Готов немедленно начать работу и обеспечить высокое качество выполнения.
Актуальные фриланс-проекты в категории Парсинг данных
Требуется специалист по продвижению в Telegram.
1286 UAH
Задачи: инвайт реальных пользователей по базе юзернеймов в новые чаты и рассылка сообщений по целевой базе. Интересует только качественный трафик и работа с живой аудиторией — исполнителей, использующих ботов, накрутку или некачественные методы, просьба НЕ БЕСПОКОИТЬ. Работа… Парсинг данных, Продвижение в социальных сетях (SMM) ∙ 1 день 21 час назад ∙ 8 ставок |
Сбор B2B базы данных компаний в Германии
1801 UAH
Цель: Получение списка потенциальных работодателей (клиентов) для B2B рассылки. Регион: Мюнхен (München) + радиус 50 км. Требуемые ниши: Строительные компании (Bauunternehmen) Пищевые предприятия (Lebensmittelhersteller, мясокомбинаты, пекарни) Логистика и складские… Парсинг данных, Продажи и генерация лидов ∙ 1 день 23 часа назад ∙ 31 ставка |
Консультация по парсингу подписчиков Instagram-аккаунтовЗдравствуйте. Необходимо провести предварительную оценку возможности выполнения следующей задачи. У меня есть список Instagram-аккаунтов. Цель — получить контактные данные (в первую очередь email-адреса) пользователей, которые подписаны на эти аккаунты. Ранее мне встречались… Парсинг данных ∙ 5 дней 16 часов назад ∙ 12 ставок |
Нужен специалист для поиска контактов ЛПР по УкраинеНеобходимо собрать базу (или готовую базу) контактов лиц, принимающих решения (ЛПР), в компаниях Украины. Поиск и сбор информации, Парсинг данных ∙ 5 дней 21 час назад ∙ 18 ставок |
Необходимо спарсить данные из LinkedinНеобходимо спарсить данные с Linkedin по нашему списку. Для каждой записи нужно найти и собрать доступные данные, если такие есть на Linkedin профиле, включая фотографию профиля в соцсети Linkedin, email-адрес, ссылки на социальные сети, вебсайт компании, номер телефона. Все… Парсинг данных ∙ 6 дней 2 часа назад ∙ 28 ставок |