Создание программного решения для автоматического сбора данных о товарах с пяти целевых сайтов
Создание программного решения для автоматического сбора данных о товарах с пяти целевых интернет-ресурсов и объединение их в единую сводную таблицу (Excel/Google Sheets).
1. Собираемые данные (Колонки в итоговой таблице)
Для каждого товара необходимо извлечь:
Наименование (полное название товара).
Цена (актуальная цена, цена без скидки — если есть).
Ссылка на товар (прямой URL).
2 Технические требования
Обход защиты: Реализация обработки динамического контента (JavaScript), если сайт его использует. Использование прокси-серверов или задержек (user-agent вратация) для предотвращения блокировок.
Сводная таблица:
Формат: .XLSX или запись напрямую в Google Sheets.
Важно: Реализовать логику сопоставления товаров (если названия на сайтах немного отличаются, предусмотреть возможность склейки по артикулу).
3 Функционал (Интерфейс)
Возможность запуска парсинга по требованию.
Опционально: Настройка расписания (например, раз в сутки).
Логирование ошибок (если страница товара не загрузилась или изменилась структура сайта).
-
Добрый день. Для оценки проекта нужно ознакомиться с конкретными ресурсами. Указываю минимально возможную стоимость.
-
Здравствуйте, имел опыт в схожих проектах, подобный функционал уже разрабатывался.
Мне бы хотелось просмотреть с каких сервисов мы будем брать данные, далее уже можно будет прикинуть примерный бюджет
Напишите в личные сообщения
-
Добрый день
Профессионально занимаюсь парсингом сайтов. Выполню все качественно и быстро.
Для точной оценки нужно подробнее обсудить ТЗ
Буду рад сотрудничеству
-
Здравствуйте. Сделаю парсер для 5 сайтов: название, цена, URL, матчинг по артикулу, выгрузка в XLSX/Google Sheets, логирование — напишите список сайтов, стартуем сегодня.
-
Доброй ночи, могу написать парсер с удобным интерфейсом для автоматического сбора данных. Перед выполнением, хотелось бы уточнить что имеете ввиду возможность склейки по артикулу (название из всех в один собирать или что бы были только уникальные артикулы)? После ознакомления с сайтами и полным ТЗ будет стоимость и сроки
-
650 2 0 Здравствуйте!
Разработаем парсер для сбора данных с 5 сайтов в единую таблицу:
— Сбор по каждому товару: название, цена, цена без скидки, прямая ссылка
— Обработка динамического контента (JavaScript-сайты) через Playwright
— Ротация User-Agent и задержки для обхода блокировок
— Сводная таблица в формате XLSX или Google Sheets
— Логика сопоставления товаров по артикулу (даже если названия отличаются)
… — Запуск по запросу + опционально расписание (раз в сутки)
— Логирование ошибок
Напишите в личные сообщения — скиньте список сайтов, уточним структуру и назовем стоимость.
-
346 Здравствуйте!
Смогу реализовать решение в соответствии с описанием проекта.
Готов обсудить детали.
-
1973 17 0 1 Здесь задача не в самом парсинге, а в стабильном сборе данных с 5 разных магазинов с нормализацией названий, цен и корректной склейкой одинаковых товаров в одной таблице. Я работаю с e-commerce каталогами, фидами и автоматизацией импорта, поэтому могу собрать решение с запуском по требованию, логированием ошибок и выгрузкой в Excel или Google Sheets. По реализации вижу это как отдельный Python-сервис: для каждого сайта — свой модуль сбора, при необходимости с поддержкой JavaScript через Playwright, затем слой нормализации данных и сопоставление товаров по артикулу/SKU. Если на части сайтов артикулы отсутствуют, добавлю резервную логику сопоставления по бренду, модели и похожему названию, чтобы не смешивать разные позиции. После просмотра 5 целевых сайтов смогу зафиксировать смету; предварительно такой проект займет 7–12 рабочих дней Пришлите, пожалуйста, список сайтов и пример 10–15 товаров, которые точно нужно “склеивать” между источниками — так я сразу скажу точную архитектуру и объем работ.
-
265 Добрый день!
Есть 3+ года опыта в разработке парсеров, автоматизации сбора данных, обработке динамического контента и выгрузке результатов в Excel / Google Sheets.
Могу реализовать решение для автоматического сбора данных с 5 целевых сайтов с последующим объединением в одну сводную таблицу: наименование товара, цена, ссылка, а также логика сопоставления позиций между разными источниками.
При необходимости можно добавить запуск по расписанию, логирование ошибок и запись напрямую в Google Sheets, чтобы решение было удобным для регулярного использования, а не только для разового парсинга.
Предлагаю обсудить детали, а также стоимость и сроки в личных сообщениях.
-
1422 13 0 Здравствуйте!
Могу реализовать. Настрою стабильный парсинг с учетом прокси, задержек и ротации user-agent, а также логику сопоставления товаров (по артикулу или схожести названий). Опыт в сложном парсинге и агрегации данных есть.
В результате получите готовый инструмент: запуск вручную или по расписанию, логирование ошибок, актуальные цены и сводную таблицу, готовую для анализа.
Подскажите, пожалуйста, есть ли у товаров стабильный артикул на всех сайтах, или нужно делать сопоставление по названию?
-
261 Привет! Сделаю стабильный парсер с обходом защит, умным сопоставлением товаров и автоматической выгрузкой в таблицу.
Как реализую:
• Сбор данных: Python + Playwright (для JS-рендеринга) / Requests + BeautifulSoup. Ротация User-Agent, адаптивные задержки, пул прокси для защиты от банов.
• Сопоставление товаров: Приоритет — артикул/SKU. Если отсутствует — fuzzy-matching (RapidFuzz) + нормализация названий. Настрою пороги слияния под вашу номенклатуру.
• Вывод: Прямая запись в Google Sheets (live-обновление) + экспорт в .xlsx. Таблица сразу готова к работе.
• Управление: Запуск по требованию или по расписанию (cron / простой интерфейс / Telegram-бот). Подробное логирование ошибок, алерты при изменении структуры сайтов.
Срок: 5–7 дней
Формат: исходный код + инструкция по запуску/настройке + 14 дней поддержки.
Пришлите список из 5 сайтов — сделаю бесплатный аудит структуры и покажу демо-выгрузку за 24 часа. Готов стартовать сразу после согласования.
-
294 1 0 Здравствуйте, Максим! Заинтересовал ваш проект по созданию системы мониторинга.
У меня есть готовые наработки на Python + Playwright, что гораздо эффективнее и быстрее упомянутого Selenium при работе с динамическим контентом (JS) и защитой от ботов.
Что я предлагаю:
Стабильный обход защит: Использование ротации сессий и качественных прокси.
Умное сопоставление: Реализую логику склейки товаров по артикулам или по схожести наименований, чтобы сводная таблица была чистой.
Удобный формат: Выгрузка в Excel или Google Sheets «на лету».
… Готов обсудить детали и целевые ресурсы. На связи!»
-
3390 24 0 Максим, добрый день. Есть схожие кейсы в портфолио - парсеры олх и авто.про с выгрузкой в Google Sheets. Реализую сбор через playwright с ротацией user agent и прокси, матчинг товаров по артикулу через rapidfuzz, логирование ошибок в отдельный файл.
Срок: 4 дня. Бюджет: 3500. Пишите.
-
138 Приветствую! Готов реализовать решение на C#. Имею опыт работы с парсингом HTML и регулярными выражениями и Selenium. Могу настроить автоматизированный сбор данных с сохранением в удобный формат (JSON, CSV или Excel). Сделаю упор на скорость работы и маскировку под реального пользователя, чтобы избежать блокировок. Готов обсудить детали и приступить к работе. Срок от 1 до 3 дней
-
97 34 4 2 У меня значительный опыт в создании парсеров и систем автоматизации на базе Node.js и Laravel, которые идеально подходят для таких задач.
Я неоднократно реализовывал решения для обхода защиты сайтов, используя инструменты для рендеринга динамического контента (Puppeteer/Playwright), ротацию прокси-серверов и эмуляцию поведения реального пользователя. Также у меня есть опыт разработки алгоритмов сопоставления данных по артикулам и интеграции с Google Sheets API для автоматического обновления таблиц.
По запросу могу отправить примеры моих работ, где реализован схожий функционал: сбор данных в сложных условиях и их структурирование в удобные отчеты.
Поскольку сложность структуры сайтов и уровень их защиты могут существенно различаться, мне нужно ознакомиться с целевыми ресурсами. После краткого анализа ссылок я смогу предоставить вам точную оценку стоимости и сроков выполнения проекта.
Предлагаю обсудить детали технического задания в чате. Буду рад помочь в решении вашей задачи!
-
655 6 1 Здравствуйте! Готов разработать решение для автоматического сбора данных о товарах с пяти целевых сайтов. Учитывая секретность сайтов ставка приблизительная.
-
2138 22 2 привет, у меня большой опыт парсинга
предоставьте список сайтов, которые нужно парсить
готов сделать для вас автономную систему, которая будет работать на вашем сервере
цена 5-10к грн, пишите, договоримся
-
349 Добрый день.
Имела опыт в создании бота который парсит сайты с заказами, делала его на Python.
Ваш проект очень похож на тот что я делала. Могу реализовать его на Python данный проект.
-
716 4 0 Здравствуйте!
10 лет я специализируюсь на сложных проектах, которые требуют высокой квалификации.
У меня большой опыт с подобными проектами.
Могу профессионально разработать программу для автоматического сбора данных о товарах с пяти целевых сайтов.
Точная цена после уточнения ТЗ.
План работы:
Анализ целевых сайтов: оценка структуры, наличия JavaScript, антибот-защиты, доступности данных в коде или через API
Проектирование архитектуры: выбор стеков, схема сбора данных, очереди задач, база для временного хранения
… Разработка парсеров для каждого из пяти ресурсов: обработка динамического контента, селекторы данных, нормализация названий и цен
Реализация механизма обхода защиты: ротация user-agent, задержки между запросами, подключение прокси-серверов
Создание логики сопоставления товаров: склеивание по артикулу, нечеткий поиск по названию, приоритеты источников
Интеграция экспорта: генерация .XLSX файлов или прямая запись в Google Sheets через API
Разработка интерфейса запуска: кнопка старта, настройка расписания, логирование процесса и ошибок
Настройка системы уведомлений: алерты при изменении структуры сайта или критических ошибках
Тестирование стабильности, проверка качества данных, оптимизация скорости сбора
Подготовка документации, инструкции по запуску и передаче поддержки.
-
231 У вас есть список из 5 целевых сайтов и пример артикула/правил сопоставления (чтобы «склеивать» товары с разными названиями)? Также подскажите, куда удобнее выгружать итог — Google Sheets или .XLSX?
Мы сделаем парсер на Python с обработкой динамики (Playwright), ротацией прокси и user-agent, ретраями и логированием ошибок. Запуск — по требованию (CLI/панель) + опционально расписание (cron/Cloud Scheduler). Данные будем хранить в Google Sheets или .XLSX, реализуем сопоставление по артикулу + нечеткое сравнение названий. У нас есть опыт сбора данных для маркетплейсов и построения надежных ETL-пайплайнов.
Готовы стартовать с пилота по одному сайту и быстро согласовать формат таблицы. Напишите, чтобы согласовать целевые ресурсы и критерии соответствия.
-
2335 37 0 Привет. Задание понял.
С парсингом E-commerce работаю постоянно. Сразу скажу, где тут будут главные проблемы и как я их закрываю:
Защита от ботов (Cloudflare/DataDome). Сайты будут резать запросы и банить IP. Решается это через Python + Playwright, плюс подключаю пул резидентных прокси с ротацией и рандомизацией отпечатков браузера.
Изменение верстки. Магазины часто обновляют дизайн. Чтобы парсер не ложился от каждой смены кнопки, пишу гибкие селекторы.
Склейка товаров (матчинг). Наиболее сложное. Если артикулов нет, обычная сверка по названию даст кашу. Буду использовать алгоритмы нечеткого поиска (Levenshtein), чтобы понимать, что "iPhone 15 Pro 256GB" и "Apple iPhone 15 Pro 256 Гб" — это один товар. Все, что будет иметь сомнительный процент совпадения, падет в отдельную колонку для ручного подтверждения.
…
Ориентировочно по деньгам это $200–300, по срокам — 10-14 дней.
Скиньте, пожалуйста, ссылки на эти 5 сайтов — гляну, насколько там жесткий антифрод, и смогу назвать точную цену и сроки.
-
1490 28 0 Могу выполнить, пишите для обсуждения подробностей. Цена и срок условно....
-
232 Здравствуйте! Наша команда имеет 4 года опыта в разработке систем автоматизации и парсинга данных, поэтому мы готовы создать надежное программное решение для вашей задачи. Процесс реализации будет включать глубокий анализ целевых источников, разработку архитектуры сбора данных на базе Python (Selenium/Playwright) или C# для обхода защиты и капчи, настройку фильтрации и структурирования информации в нужный формат (SQL, CSV, JSON), а также финальное тестирование на сервере для стабильной работы 24/7.
Ориентировочная стоимость разработки — от 20 000 грн, срок выполнения — 10–14 дней, а точный график и финальный бюджет мы обсудим в личных сообщениях после анализа всех входных данных.
Мы готовы приступить к выполнению проекта в ближайшее время. Подскажите, есть ли у вас список конкретных источников (сайтов), которые требуют первоочередной настройки сбора данных?
Наши работы:
farfieworldwide.com
freshagro.com.ua
-
3305 70 1 Здлравствуйте.
Смогу реализовать ришения согласно описанию проекта.
Готов обсудить проект и познакомится с донорами
-
4975 41 4 1 Добрый день!
Готов реализовать программное решение для автоматического сбора данных с пяти сайтов. Имею опыт обработки JavaScript, обхода защит (прокси, user-agent), интеграции с Google Sheets и разработки логики сопоставления товаров. Предусмотрю запуск по требованию и логирование ошибок.
Напишите, обсудим детали!
-
1682 2 0 Maksym, ознакомился с описанием — задача понятная и под мой стек.
Реализую сборщик на Python + Playwright: для каждого из пяти сайтов извлеку полное название товара, актуальную цену и цену без скидки (если есть), прямой URL. Для сайтов с JS-рендерингом Playwright обрабатывает динамический контент нативно. Подключу ротацию user-agent и прокси-серверы, чтобы избежать блокировок. Результат — XLSX-файл через openpyxl или запись напрямую в Google Sheets через API, на ваш выбор. Для сопоставления товаров между сайтами реализую нечёткий матчинг по артикулу + названию (rapidfuzz) — если артикулов нет, договоримся о fallback-логике. Запуск — по требованию через CLI, опционально добавлю cron-расписание (раз в сутки). Логирование ошибок — в отдельный файл с деталями по каждой странице.
Один момент: можете раскрыть, какие конкретно пять сайтов нужно парсить? Если там стоит Cloudflare или Datadome — это влияет на оценку объёма работ, хочу учесть сразу.
Цена: 14 400 UAH, срок — 5 дней.
-
260 Добрый вечер, разработаем ТЗ, и сделаем всё быстро и качественно.
Сбор информации можем оформить многими способами, пишите в сообщения.
Обработаем любой вид защиты, и всё выгрузим по Вашим требованием.
Пишите, дороворимся за сроки
-
297 Здравствуйте!
У меня есть опыт разработки парсеров для сбора товаров с нескольких сайтов с последующим объединением в единую таблицу.
Как я реализую:
- Сбор названия товара, цены и ссылки
- Обработка сайтов с JavaScript (Playwright или API, если доступно)
- Защита от блокировок (задержки, user-agent, при необходимости прокси)
- Формирование сводной таблицы (Excel или Google Sheets)
… - Логика сопоставления товаров (по артикулу или похожему названию)
Дополнительно:
- Возможность запуска по расписанию
- Логирование ошибок
- Готовый структурированный результат для дальнейшей работы
Работал с подобными задачами (маркетплейсы, каталоги товаров, большие объемы данных).
Для уточнения:
- какие именно сайты нужно парсить
- пример товаров для корректного сопоставления
- формат результата (Excel или Google Sheets)
Готов начать сразу после согласования деталей.
Актуальные фриланс-проекты в категории Парсинг данных
Парсинг товаров, подготовка к импорту на WPСпарсить полный каталог этих сайтов: https://svit-mebliv.ua/ https://kompanit.com.ua/ru https://amia.com.ua/ https://mebliromax.com.ua/ https://pehotin.com.ua/catalog/ https://www.sokme.ua/ru/ Все товары нужно объединить в одну обющую таблицу для импорта в WP. Каждый товар… Веб-программирование, Парсинг данных ∙ 1 день 18 часов назад ∙ 54 ставки |
Шукаю програміста для опен картаДоброе время суток 1)нужно внедрить на сайте dneprkomfort.dp.ua был куплен модуль для украинских банков уже внедрили Моно банк вот пример нашего конкурента Нужно как cделать розсрочку, покупка частями (МоноБанк) Пумб, Сенс, Моно по умолчанию 2 платежа 2 мес Пумб по умолчанию 3… Веб-программирование, Парсинг данных ∙ 2 дня 15 часов назад ∙ 48 ставок |
Требуется специалист по продвижению в Telegram.
1273 UAH
Задачи: инвайт реальных пользователей по базе юзернеймов в новые чаты и рассылка сообщений по целевой базе. Интересует только качественный трафик и работа с живой аудиторией — исполнителей, использующих ботов, накрутку или некачественные методы, просьба НЕ БЕСПОКОИТЬ. Работа… Парсинг данных, Продвижение в социальных сетях (SMM) ∙ 6 дней 17 часов назад ∙ 9 ставок |
Консультация по парсингу подписчиков Instagram-аккаунтовЗдравствуйте. Необходимо провести предварительную оценку возможности выполнения следующей задачи. У меня есть список Instagram-аккаунтов. Цель — получить контактные данные (в первую очередь email-адреса) пользователей, которые подписаны на эти аккаунты. Ранее мне встречались… Парсинг данных ∙ 10 дней 12 часов назад ∙ 13 ставок |
Нужен специалист для поиска контактов ЛПР по УкраинеНеобходимо собрать базу (или готовую базу) контактов лиц, принимающих решения (ЛПР), в компаниях Украины. Поиск и сбор информации, Парсинг данных ∙ 10 дней 17 часов назад ∙ 22 ставки |