Потрібен парсер інтернет-магазину https://www.lcsc.com/
потрібно регулярно (1 раз на місяць, або при запуску скрипта) отримувати актуальну інформацію про товари в наявності магазину
з каталогу всіх розділів
тільки товари "In Stock" (близько 650 000 товарів)
дані повинні бути вивантажені у файл XLSX у форматі (по стовпцях):
Назва розділу, MPN, Виробник, Наявність, Опис, Упаковка, Ціноутворення (8 стовпців типу: Кількість1, Ціна1, Кількість2, Ціна2, Кількість3, Ціна3, Кількість4, Ціна4)
можливість подальшої доопрацювання та коригування скрипта при зміні структури парсованого каталогу
Додатки 1
-
Вітаю! Зацікавила задача «Нужен парсер интернет-магазина https://www.lcsc.com/». Маю досвід з API-інтеграціями, обміном даними, парсерами, вебхуками та автоматизацією процесів. Зможу акуратно підключити потрібні сервіси, обробити помилки/повтори і зробити рішення, яке буде стабільно працювати після запуску.
Виконаємо якісно. Роботи на сайті портфоліо -
Доброго дня
Оглянув сайт та готовий якісно написати парсер
Ціна залежить від деталей ТЗ
Звертайтесь
-
Добрий день. Готовий виконати, кінцева вартість залежить від деталей, які потрібно обговорити. Вказую мінімально можливу.
Буду радий співпраці! -
310 Привіт!
Подивився сайт і задачу — все зрозуміло.
Ключовий момент, який важливий на такому обсязі (650k товарів):
LCSC віддає не більше 5000 товарів за запит через
внутрішній JSON API. Тому буду використовувати
рекурсивний обхід підкатегорій з мікрофільтрами —
щоб кожна вибірка була меншою за ліміт.
…
Що реалізую:
— Python скрипт з прямими запитами до JSON API LCSC
(швидше і стабільніше ніж парсинг HTML)
— Фільтр тільки "In Stock" товарів
— Збереження прогресу (checkpoint) — при обриві
скрипт продовжує з місця зупинки, не з нуля
— Логування прогресу — видно скільки % зібрано
— Вивантаження в XLSX точно по в
-
387 Доброго дня.
Завдання зрозуміле: потрібен не разовий парсинг, а стабільний скрипт, який можна запускати регулярно і отримувати актуальний XLSX по товарам LCSC тільки зі статусом In Stock.
Я подивився приклад файлу: структура зрозуміла - розділ, MPN, Виробник, Наявність, Опис, Упаковка та 4 пари Кількість/Ціна. Зроблю вивантаження в такому ж форматі, щоб файл можна було відразу використовувати далі.
На такому обсязі важливо не парсити HTML “в лоб”, а спочатку перевірити внутрішні API-запити LCSC. Це швидше, стабільніше і простіше підтримувати при змінах сайту. Також заклав би збереження прогресу, повтори при помилках, логування і можливість перезапуску без втрати вже зібраних даних.
Мій стек: JavaScript/TypeScript, REST API, робота з даними та автоматизація. Можу зробити скрипт з ручним запуском, а при необхідності - підготувати варіант для щомісячного запуску.
…
Питання: вам потрібен тільки підсумковий XLSX після кожного запуску, чи також потрібен проміжний кеш/база, щоб при наступному запуску оновлювати дані швидше?
-
232 Доброго дня! Писав парсери каталогів електроніки під ключ — з пагінацією, фільтром «In Stock» і вивантаженням цінових тіерів у XLSX, тож формат із вашими 8 стовпцями по кількості/ціні зроблю один-в-один. На такому обсязі (650к позицій) збиратиму через їхній внутрішній API — це швидше й стабільніше за HTML, і скрипт лишиться перезапускним щомісяця. Орієнтовно 4-5 днів. Підкажіть, потрібні зараз лише наявні товари чи весь каталог із позначкою наявності?
-
427 Вітаю! Бачу, що бюджет проєкту дозволяє підійти до задачі серйозно. 650 000 товарів — це навантаження, яке вимагає побудови справжнього Data Pipeline, а не простого скрипта-парсера.
Моє рішення — це створення надійної системи збору даних, яка гарантовано допрацює до кінця, навіть якщо інтернет зникне або сайт тимчасово заблокує IP.
Чому моє рішення — це інвестиція, а не просто код:
1. Архітектура "Resumable Download": Найбільша проблема при зборі 650к записів — це переривання роботи. Мій софт зберігає стан черги в SQLite. Якщо скрипт впаде на 300-й тисячі, ви запустите його знову, і він продовжить з 300 001-го товару, а не почне з нуля.
2. Професійна робота з даними (Stream processing): Скрипт не перевантажує оперативну пам'ять (RAM). Він зчитує та записує дані потоково (streaming), тому навіть файл на сотні мегабайтів генерується на будь-якому VPS.
3. API-First підхід: Я не буду імітувати натискання кнопок. Скрипт працює безпосередньо з внутрішнім JSON API сайту. Це забезпечує максимальну швидкість (мілісекунди на запит) та довговічність (скрипт не "помре" при зміні дизайну сайту).
4. Масштабованість під доопрацювання: Код написаний на основі чистих PHP-класів (SOLID). Якщо структура даних на LCSC зміниться або вам знадобиться додати новий стовпець — це робиться зміною 3-4 рядків у конфігурації.
… 5. Захист від банів: Вбудована логіка ротації проксі, імітація "людських" пауз та обробка HTTP-помилок (429, 503), щоб обійти антифрод-системи LCSC.
• Технології: Pure PHP 8.x (CLI), Guzzle (Async), SQLite (state management), FastExcel.
• Вартість: 16 000 грн (повна розробка, налаштування логіки проксі та інструкція для запуску).
• Термін: 6 днів (з урахуванням часу на стрес-тести).
Я пропоную інженерну якість, яка позбавить вас необхідності наймати когось для підтримки цього скрипта в майбутньому. Готовий розпочати роботу!
-
2409 8 1 Вітаю!
Задача зрозуміла: потрібно регулярно збирати з LCSC всі товари “In Stock” по всіх розділах каталогу і вивантажувати їх у XLSX у чітко заданому форматі.
Що можу закрити:
— стабільний парсер під великий обсяг даних (~650 000 товарів) з проходом по всіх категоріях;
— вивантаження в Excel з потрібними колонками: розділ, MPN, Manufacturer, Availability, Description, Package, Pricing;
— запуск по кнопці або за розкладом + можливість подальшого доопрацювання, якщо структура каталогу зміниться.
… Працюю з Python, великими парсингами, Excel-експортом і підтримкою таких скриптів, тому можу зробити не разовий збір, а робочий інструмент для регулярного використання.
-
1520 2 0 Доброго дня!
Ознайомився з вашим ТЗ та прикріпленим прикладом файлу. Завдання зрозуміле: потрібен регулярний дамп каталогу LCSC.com (тільки товари "In Stock", близько 650к позицій) з правильною розбивкою оптової цінової сітки (Кількість/Ціна до 4 рівнів) у форматі XLSX.
Я Python-розробник і спеціалізуюсь на створенні високонавантажених парсерів та роботі з Data-pipeline.
Багато розробників пропонують парсити такі сайти через емуляцію браузера (Selenium), але на обсязі в 650 000 товарів це буде працювати добу.
Як я реалізую цей парсер (Архітектура рішення):
…
Робота безпосередньо з Backend API: LCSC.com динамічно підвантажує товари через приховані JSON API ендпоінти. Я напишу скрипт, який буде звертатися безпосередньо до цих API. Це прискорить збір даних у 100 разів.
Обхід ліміту в 5000 товарів: Платформа не дозволяє пролистати більше 50-100 сторінок пагінації за раз. Щоб витягнути всі 650к, я напишу алгоритм глибокого обходу (Deep Crawl), який буде рекурсивно провалюватися в підкатегорії та застосовувати мікро-фільтри, щоб у кожній вибірці було менше 5000 товарів.
Швидкість і стабільність: Я зберу скрипт на асинхронному руслі (Aiohttp/Asyncio). Прикрутимо ротацію проксі (проксі включимо в бюджет) і систему retry. Якщо LCSC тимчасово заблокує IP, парсер просто змінить проксі, почекає кілька секунд і продовжить роботу з місця обриву.
Формування XLSX: Динамічний парсинг цінової сітки (Pricing tiers) і запис у потрібний вам формат (8 стовпців для цін) через бібліотеку pandas. Файл не буде важити гігабайти і легко відкриється в Excel.
Скрипт буде забезпечений конфігом і детальним логгером (щоб ви бачили, який відсоток каталогу вже зібрано). При зміні структури сайту (якщо вони оновлять API), код легко масштабується і виправляється, оскільки я пишу в строгому ООП-стилі.
Готовий стартувати відразу. Напишіть у особисті повідомлення, і я покажу, як саме ми будемо витягувати матрицю цін!
-
1964 25 1 Добрий день. Можу реалізувати такий парсер, а також його щомісячне обговорення (мануальне або автоматичне). Однак варто обговорити деталі. Давайте поспілкуємось в лс?
-
2025 4 0 Привіт!
У мене великий досвід розробки рішень для парсингу та обробки даних (різні джерела, захист від блокувань, автоматизація). Готовий реалізувати поставлене завдання в найкоротші терміни.
Пропоную обговорити деталі в особистих повідомленнях.
-
702 1 0 Вітаю! Готовий до співпраці. Маю досвід створення парсерів. Пропоную якісну та швидку роботу.
Пишіть)
-
2663 41 2 1 МОжу допогти з виконанням, в них також є api що полегшує роботу
-
2116 20 0 Доброго дня. Завдання зрозумів: потрібен скрипт, який при запуску обходить весь каталог lcsc.com по всіх розділах, бере тільки товари In Stock, близько 650 тисяч позицій, і експортує їх у XLSX з колонками розділ, MPN, виробник, наявність, опис, корпус і цінові пари кількість і ціна по чотирьох рівнях. Запускається раз на місяць або вручну, плюс можливість редагування під зміни структури каталогу.
Щодо реалізації: у lcsc є внутрішній JSON-API, який віддає каталог по сторінках, тому в першу чергу дивився б у бік роботи безпосередньо з цими запитами, а не парсингу HTML. Це і швидше, і стабільніше на обсязі в півмільйона позицій, і легше виправляти при змінах. Якщо частина даних закрита або захищена, додаю Selenium тільки на проблемні ділянки.
На обсязі 650 тисяч важлива стійкість, тому заклав би відновлення з місця обриву, контроль дублів по MPN, акуратні паузи і ретраї під антибот, при необхідності проксі, плюс прогрес у лог, щоб прогін можна було перезапускати без втрати зібраного. Експорт у XLSX через pandas або openpyxl з точною структурою колонок, що в ТЗ, включаючи чотири пари кількість і ціна.
Парсери на Python з Selenium, BeautifulSoup і pandas роблю давно. Щоб оцінити точніше: цінові рівні потрібні саме ті, що показані для роздрібної кількості, чи важливі всі ступені опту зі сторінки товару? Від цього залежить, скільки запитів на позицію. Готовий почати з розбору структури їх API на кількох розділах, щоб зафіксувати формат експорту і термін.
-
172 1 1 Доброго дня. Готовий виконати цей проект, маю великий досвід розробки різних додатків.
-
1490 28 0 готовий виконати ваше завдання, пишіть для обговорення деталей..........................
-
620 2 0 Добрий день.
Подивився приклад файлу — структура зрозуміла, завдання чітке.
Пропоную Python-скрипт з двома режимами роботи:
1. Через LCSC API — якщо є доступ:
— Пакетні запити по 100–200 товарів за раз
— 650 000 товарів — близько 1–2 годин
…
2. Через Playwright (браузерний парсинг) — якщо API недоступний:
— Поштучно, обхід anti-bot захисту
— 650 000 товарів — 8–12 годин, рекомендую запуск на VPS
Що увійде в обох випадках:
— Обхід усіх розділів, фільтр «In Stock»
— Вивантаження 14 стовпців у форматі вашого прикладу
— Збереження прогресу (checkpoint) — при обриві скрипт продовжує з місця зупинки
— Документація та можливість правки при зміні структури сайту
Вартість: 8 000 – 12 000 грн. Термін: 5–7 днів.
Уточніть: чи є у вас доступ до LCSC API?
-
3861 15 0 Доброго дня.
У мене великий досвід у парсингу, зокрема товарів з інтернет-магазинів, а не xml вивантажень.
Також парсив для себе авто- мото- запчастини та одяг з кількох джерел - де величезна кількість товарів.
Навіть мав досвід у парсингу бази даних СНД-сайтів.
Взагалі досвіду достатньо для виконання Вашого завдання якісно та в найкоротші терміни.
Завдання зрозуміле, можу приступити прямо зараз.
-
2652 56 0 Доброго дня, щацікавив вашйи проект, давайте обговоримо деталі в чаті
-
441 4 0 Доброго вечора, готовий виконати ваше замовлення і буду радий подальшій співпраці. Пишіть сюди в лс, скину вам приклади своїх робіт. Ще можу скинути ссилку на портфоліо)
-
9927 117 0 Доброго дня.
Розробляю парсери на NodeJS. Готов взятися. Пишіть, обговоримо.
-
4146 123 0 Пишу парсери на Пітоні для різних, звертайтеся, все зробимо.
-
3367 84 0 Готовий взятися.
Треба уточнити деталі замовлення, пишіть!
Використовую python, uv, github, docker.
-
318 Вже зробив скрипт на Python. Там мільйони товарів. Доведеться розбивати на файли. І робити паузи між запитами на сайт, бо заблокують. Можу показати готовий файл на 800 товарів. Звертайтеся для уточнення кінцевого результату.
-
1815 32 1 Добрий день, веб-програмуванню вже більше 9 років
Працюю з rest api, фреймворками та cms такими як django, laravel, yii2, wp, opencart, codeigniter тощо. Готовий виконати завдання.
Відгуки:Freelancehunt
-
246 1 1 Доброго дня, готовий взятися за проект, досвід є, чекаю на відповідь.
-
4975 41 4 1 Доброго дня!
Спеціалізуюсь на розробці парсерів та автоматизації. Готовий реалізувати парсер LCSC.com на Python для регулярного збору актуальних "In Stock" товарів у XLSX, з можливістю подальшої підтримки. Маю досвід роботи з веб-скрейпінгом та великими об'ємами даних.
Напишіть в лс, уточнимо деталі.
-
321 Вітаю!
Ознайомився з вашим завданням та переглянув прикріплений приклад CSV-файлу. Завдання повністю зрозуміле — потрібно написати парсер для сайту lcsc.com, який збере необхідні дані по компонентах і точно відтворить потрібну вам структуру таблиці.
Як я це реалізую:
Напишу надійний скрипт на Python. Якщо сайт використовує динамічне підвантаження або захист, використаю інструменти для імітації реального браузера, щоб уникнути блокувань. Скрипт автоматично проходитиме по категоріях/посиланнях, збиратиме артикули, ціни та інші характеристики, після чого формуватиме готовий файл (CSV/Excel) рівно за вашим шаблоном.
Код буде чистим і задокументованим, щоб ви могли запускати його самостійно в майбутньому. За потреби можу запакувати все в Docker.
… Уточнювальне запитання:
Парсинг потрібен одноразово (просто зібрати базу на зараз), чи цей скрипт має запускатися регулярно для оновлення залишків та цін?
-
2794 77 1 Доброго дня. З сайтом ознайомився. Можу наисати парсер який буде потрібні вам дані в табицю Ексель.
-
1825 52 0 Добрий день. Можу написати консольну програму для парсингу цих товарів на python. Вкладений файл чомусь не відкривається - можете повторно надіслати в лс?
-
96620 1276 1 10 Вітаю.Є великий досвід в розробці парсерів.Готовий до співпраці.
-
1770 20 0 Напишу парсер, розміщую на своїх ресурсах з подальшою підтримкою. Для збору такого кількості потрібні проксі, включаються в підтримку. Також сайт віддає не більше 5000 товарів за раз, потрібна розбивка по фільтрам. Пишіть, обговоримо деталі.
-
3406 32 0 Вітаю!
Напишу скрипт під ваші потреби, котрий буде проходить по сторінкам пагінації усіх розділів і отримувати інформацію про наявність та ціни на товари
-
4611 52 1 Привіт, я Python-розробник, маю досвід у розробці парсерів різної складності. Можу виконати ваш проект швидко та якісно. Пишіть - обговоримо деталі. Приступити до роботи готовий вже сьогодні.
-
6811 164 1 Добрий день, можу зробити програму і віддати Вам, або можу збирати дані за Вашим запитом. Пишіть, обговоримо.
-
726 9 1 Привіт! Я уважно вивчив ваш проект і готовий розпочати його реалізацію. Давайте обговоримо деталі для найкращого виконання.
Актуальні фриланс-проєкти в категорії Парсинг даних
Спарсити базу і добавити в тг чатСпарсити базу з Ліст юа і додати по номерам в телеграм чат. Чат на тему ремонту та дизайну інтер`єру. Парсинг даних, Робота з клієнтами ∙ 6 годин 53 хвилини тому ∙ 19 ставок |
Потрібно розробити Telegram-бота для моніторингу автомобілів з аукціонів США (Copart, IAAI)Потрібно створити Telegram-бота для автоматичного пошуку та моніторингу автомобілів "BUY IT NOW" на аукціонах США (Copart, IAAI) Бот повинен працювати в автоматичному режимі та надсилати повідомлення про нові автомобілі, які відповідають заданим фільтрам.Основний… Парсинг даних, Розробка ботів ∙ 14 годин 26 хвилин тому ∙ 66 ставок |
Парсинг товарів, підготовка до імпорту на WPСпарсити повний каталог цих сайтів: https://svit-mebliv.ua/ https://kompanit.com.ua/ru https://amia.com.ua/ https://mebliromax.com.ua/ https://pehotin.com.ua/catalog/ https://www.sokme.ua/ru/ Всі товари потрібно об'єднати в одну загальну таблицю для імпорту в WP. Кожен товар… Веб-програмування, Парсинг даних ∙ 3 дні 7 годин тому ∙ 57 ставок |
Требуется спеціаліст з просування в Telegram.
1273 UAH
Завдання: інвайт реальних користувачів за базою юзернеймів у нові чати та розсилка повідомлень по цільовій базі. Цікавить тільки якісний трафік і робота з живою аудиторією — виконавців, які використовують ботів, накрутку або неякісні методи, прохання НЕ БЕСПОКІТЬ. Робота… Парсинг даних, Просування у соціальних мережах (SMM) ∙ 8 днів 6 годин тому ∙ 9 ставок |
Консультація по парсингу підписників Instagram-акаунтівДоброго дня. Необхідно провести попередню оцінку можливості виконання наступного завдання. У мене є список Instagram-акаунтів. Мета — отримати контактні дані (в першу чергу email-адреси) користувачів, які підписані на ці акаунти. Раніше мені зустрічалися компанії та сервіси, які… Парсинг даних ∙ 12 днів 1 година тому ∙ 13 ставок |