Нужен парсер интернет-магазина https://www.lcsc.com/
нужно регулярно (1 раз в месяц, или по запуску скрипта) получать актуальную информацию о товарах в наличии магазина
из каталога всех разделов
только товары "In Stock" (около 650 000 Товаров)
данные должны быть выгружены в файл XLSX в формате (по столбцам):
Наименование раздела, MPN , Manufacturer, Availability, Description, Package, Pricing (8 столбцов типа : Количество1, Цена1, Количество2,Цена2,Количество3,Цена3,Количествл4,Цена4)
возможность дальнейшей доработки и корректировки скрипта при изменении структуры парсируемого каталога
Приложения 1
-
Добрый день. Готов выполнить, конечная стоимость зависит от деталей, которые нужно обсудить. Указываю минимально возможную.
-
1580 3 0 Здравствуйте!
У меня большой опыт разработки решений для парсинга и обработки данных (различные источники, защита от блокировок, автоматизация). Готов реализовать поставленную задачу в кратчайшие сроки.
Предлагаю обсудить детали в личных сообщениях.
-
702 1 0 Здравствуйте! Готов к сотрудничеству. Имею опыт создания парсеров. Предлагаю качественную и быструю работу. Пишите)
-
2546 41 3 1 Могу помочь с выполнением, у них также есть API, что облегчает работу.
-
2116 20 0 Здравствуйте. Задачу понял: нужен скрипт, который по запуску обходит весь каталог lcsc.com по всем разделам, берёт только товары In Stock, порядка 650 тысяч позиций, и выгружает их в XLSX с колонками раздел, MPN, производитель, наличие, описание, корпус и ценовые пары количество и цена по четырём уровням. Запускается раз в месяц или вручную, плюс возможность правки под изменения структуры каталога.
По реализации: у lcsc есть внутренний JSON-API, который отдаёт каталог постранично, поэтому в первую очередь смотрел бы в сторону работы напрямую с этими запросами, а не парсинга HTML. Это и быстрее, и стабильнее на объёме в полмиллиона позиций, и легче чинить при изменениях. Если часть данных закрыта или защищена, добавляю Selenium только на проблемные участки.
На объёме 650 тысяч важна устойчивость, поэтому заложил бы возобновление с места обрыва, контроль дублей по MPN, аккуратные паузы и ретраи под антибот, при необходимости прокси, плюс прогресс в лог, чтобы прогон можно было перезапускать без потери собранного. Выгрузка в XLSX через pandas или openpyxl с ровно той структурой колонок, что в ТЗ, включая четыре пары количество и цена.
Парсеры на Python с Selenium, BeautifulSoup и pandas делаю давно. Чтобы оценить точнее: ценовые уровни нужны именно те, что показаны для розничного количества, или важны все ступени опта со страницы товара? От этого зависит, сколько запросов на позицию. Готов начать с разбора структуры их API на нескольких разделах, чтобы зафиксировать формат выгрузки и срок.
-
172 1 1 Добрый день. Готов выполнить данный проект есть большой опыт разработки различных приложений.
-
1490 28 0 готов выполнить ваше задание, пишите для обсуждения подробностей..........................
-
448 1 0 Добрый день.
Посмотрел пример файла — структура понятна, задача чёткая.
Предлагаю Python-скрипт с двумя режимами работы:
1. Через LCSC API — если есть доступ:
— Пакетные запросы по 100–200 товаров за раз
— 650 000 товаров — около 1–2 часов
…
2. Через Playwright (браузерный парсинг) — если API недоступен:
— Постранично, обход anti-bot защиты
— 650 000 товаров — 8–12 часов, рекомендую запуск на VPS
Что войдёт в обоих случаях:
— Обход всех разделов, фильтр «In Stock»
— Выгрузка 14 столбцов в формате вашего примера
— Сохранение прогресса (checkpoint) — при обрыве скрипт продолжает с места остановки
— Документация и возможность правки при изменении структуры сайта
Стоимость: 8 000 – 12 000 грн. Срок: 5–7 дней.
Уточните: есть ли у вас доступ к LCSC API?
-
3926 15 0 Здравствуйте.
У меня большой опыт в парсинге, в том числе товаров с интернет-магазинов, а не хмл выгрузок.
Также парсил для себя и авто- мото- запчасти и одежду из нескольких источников - где огромное кол-во товаров.
Даже имел опыт в парсинге базы данных СНГ-сайтов.
Вообщем опыта достаточно для выполнения Вашей задачи качественно и в кратчайшее время.
Задача понятна могу приступить прямо сейчас.
-
2662 56 0 Добрый день, заинтересовал ваш проект, давайте обсудим детали в чате
-
346 3 0 Добрый вечер, готов выполнить ваш заказ и буду рад дальнейшему сотрудничеству. Пишите сюда в личные сообщения, скину вам примеры своих работ. Еще могу скинуть ссылку на портфолио)
-
10130 117 0 Здравствуйте.
Разрабатываю парсеры на NodeJS. Готов взяться. Пишите, обсудим.
-
4200 123 0 пишу парсеры на питоне для разных, обращайтесь все сделаем.
___________________________________________________________________
-
3224 84 0 Готов взяться. Требуется уточнить детали заказа, пишите! Использую python, uv, github, docker.
-
318 Уже сделал скрипт на Python. Там миллионы товаров. Придется разбивать на файлы. И делать паузы между запросами на сайт, потому что заблокируют. Могу показать готовый файл на 800 товаров. Обращайтесь для уточнения конечного результата.
-
1602 31 1 Добрый день, веб-программировании уже более 9 лет
Работаю с rest api, фреймворками и cms такие как django, laravel, yii2, wp, opencart, codegnither и т.д. Готов выполнить задачу.
Отзывы:Freelancehunt
-
368 1 0 здравствуйте, готов взяться за проект, опыт имеется, жду отклика.
-
4987 41 4 1 Добрый день! Специализируюсь на разработке парсеров и автоматизации. Готов реализовать парсер LCSC.com на Python для регулярного сбора актуальных "In Stock" товаров в XLSX, с возможностью дальнейшей поддержки. Имею опыт работы с веб-скрейпингом и большими объемами данных.
Напишите в личные сообщения, уточним детали.
-
321 Здравствуйте!
Я ознакомился с вашим заданием и просмотрел прикрепленный пример CSV-файла. Задание полностью понятно — нужно написать парсер для сайта lcsc.com, который соберет необходимые данные по компонентам и точно воспроизведет нужную вам структуру таблицы.
Как я это реализую:
Напишу надежный скрипт на Python. Если сайт использует динамическую подгрузку или защиту, использую инструменты для имитации реального браузера, чтобы избежать блокировок. Скрипт автоматически пройдет по категориям/ссылкам, соберет артикулы, цены и другие характеристики, после чего сформирует готовый файл (CSV/Excel) ровно по вашему шаблону.
Код будет чистым и задокументированным, чтобы вы могли запускать его самостоятельно в будущем. При необходимости могу упаковать все в Docker.
… Уточняющий вопрос:
Парсинг нужен один раз (просто собрать базу на сейчас), или этот скрипт должен запускаться регулярно для обновления остатков и цен?
-
2742 76 1 Добрый день. С сайтом ознакомился. Могу написать парсер, который будет нужные вам данные в таблицу Excel.
-
1825 52 0 Добрый день. Могу написать консольную программу для парсинга этих товаров на python. Вложенный файл почему то не открывается - можете повторно выслать в лс?
-
93984 1263 1 10 Здравствуйте. У меня большой опыт в разработке парсеров. Готов к сотрудничеству.
-
1788 20 0 Напишу парсер, размещаю на своих ресурсах с дальнейшей поддержкой.
Для сбора такого количества нужны прокси, включаются в поддержку.
Так же сайт отдает не более 5000 товаров за раз, нужна разбивка по фильтрам.
Пишите обговорим детали.
-
3411 32 0 Здравствуйте! Напишу скрипт под ваши нужды, который будет проходить по страницам пагинации всех разделов и получать информацию о наличии и ценах на товары.
-
4575 50 1 Здравствуйте, я Python - разработчик, есть опыт в разработке парсеров разной сложности. Могу выполнить ваш проект быстро и качественно. Пишите - обсудим детали. Приступить к работе готов уже сегодня
-
6850 164 1 Добрый день, могу сделать программу и отдать Вам, или могу собирать данные по Вашему запросу.
Пишите, обсудим.
-
738 9 1 Здравствуйте! Я внимательно изучил ваш проект и готов приступить к его реализации. Давайте обсудим детали для наилучшего выполнения.
-
Задайте ваш вопрос заказчику