Фриланс-проєкти

Фриланс-проєкти

Потрібен парсер інтернет-магазину https://www.lcsc.com/

Name: Потрібен парсер інтернет-магазину https://www.lcsc.com/
Price: 6000 UAH
Availability: InStock

Парсинг даних — неправильно зазначені категорії?

6000 UAH

Проєкт перекладено автоматично. Увійдіть або зареєструйтесь, щоб побачити оригінал

потрібно регулярно (1 раз на місяць, або при запуску скрипта) отримувати актуальну інформацію про товари в наявності магазину

https://www.lcsc.com/

з каталогу всіх розділів

https://www.lcsc.com/products?spm=wm.mly.dhl.mly.syy___wm.fly.dhl.mly.syy&lcsc_vid=TlVeVAICQAMMAQZVEQRdVF0ATlhfBgcCQVgNVFBeQFYxVlNeR1RbUFxUR1hZVDtW

тільки товари "In Stock" (близько 650 000 товарів)

дані повинні бути вивантажені у файл XLSX у форматі (по стовпцях):

Назва розділу, MPN, Виробник, Наявність, Опис, Упаковка, Ціноутворення (8 стовпців типу: Кількість1, Ціна1, Кількість2, Ціна2, Кількість3, Ціна3, Кількість4, Ціна4)

можливість подальшої доопрацювання та коригування скрипта при зміні структури парсованого каталогу

Ставки 49

Богдан Мельник

2 0

Проєкти -
Оцінка -
Рейтинг 478

Бюджет: 7000 UAH Термін: 5 днів

Доброго дня! Писав парсери каталогів електроніки під ключ — з пагінацією, фільтром «In Stock» і вивантаженням цінових тіерів у XLSX, тож формат із вашими 8 стовпцями по кількості/ціні зроблю один-в-один. На такому обсязі (650к позицій) збиратиму через їхній внутрішній API — це швидше й стабільніше за HTML, і скрипт лишиться перезапускним щомісяця. Орієнтовно 4-5 днів. Підкажіть, потрібні зараз лише наявні товари чи весь каталог із позначкою наявності?

Volodymyr H.

54 1

Проєкти 51
Оцінка -
Рейтинг 4 126

Бюджет: 5000 UAH Термін: 5 днів

Вітаю! Зацікавила задача «Нужен парсер интернет-магазина https://www.lcsc.com/». Маю досвід з API-інтеграціями, обміном даними, парсерами, вебхуками та автоматизацією процесів. Зможу акуратно підключити потрібні сервіси, обробити помилки/повтори і зробити рішення, яке буде стабільно працювати після запуску.

Виконаємо якісно. Роботи на сайті портфоліо

Віталій Жовнірчик

100 0

Проєкти 101
Оцінка 5.0
Рейтинг 8 135

Бюджет: 2000 UAH Термін: 1 день

Доброго дня
Оглянув сайт та готовий якісно написати парсер
Ціна залежить від деталей ТЗ

Звертайтесь

Александр Стинковый

117 0

Проєкти 118
Оцінка 5.0
Рейтинг 10 388

Бюджет: 2000 UAH Термін: 1 день

Доброго дня.

Розробляю парсери на NodeJS. Готов взятися. Пишіть, обговоримо.

Андрей К.

1 287 1

Проєкти 1 291
Оцінка 5.0
Рейтинг 103 511

Бюджет: 2500 UAH Термін: 2 дні

Вітаю.Є великий досвід в розробці парсерів.Готовий до співпраці.

Артем Плаха

150 0

Проєкти 151
Оцінка 4.9
Рейтинг 10 851

Бюджет: 1600 UAH Термін: 5 днів

Добрий день. Готовий виконати, кінцева вартість залежить від деталей, які потрібно обговорити. Вказую мінімально можливу.

Буду радий співпраці!

Дмитро Кримов

0 0

Проєкти -
Оцінка -
Рейтинг 321

Бюджет: 6000 UAH Термін: 5 днів

Привіт!

Подивився сайт і задачу — все зрозуміло.

Ключовий момент, який важливий на такому обсязі (650k товарів):
LCSC віддає не більше 5000 товарів за запит через
внутрішній JSON API. Тому буду використовувати
рекурсивний обхід підкатегорій з мікрофільтрами —
щоб кожна вибірка була меншою за ліміт.

Що реалізую:
— Python скрипт з прямими запитами до JSON API LCSC
(швидше і стабільніше ніж парсинг HTML)
— Фільтр тільки "In Stock" товарів
— Збереження прогресу (checkpoint) — при обриві
скрипт продовжує з місця зупинки, не з нуля
— Логування прогресу — видно скільки % зібрано
— Вивантаження в XLSX точно по в

Микола Ф.

0 0

Проєкти -
Оцінка -
Рейтинг 387

Бюджет: 6000 UAH Термін: 7 днів

Доброго дня.

Завдання зрозуміле: потрібен не разовий парсинг, а стабільний скрипт, який можна запускати регулярно і отримувати актуальний XLSX по товарам LCSC тільки зі статусом In Stock.

Я подивився приклад файлу: структура зрозуміла - розділ, MPN, Виробник, Наявність, Опис, Упаковка та 4 пари Кількість/Ціна. Зроблю вивантаження в такому ж форматі, щоб файл можна було відразу використовувати далі.

На такому обсязі важливо не парсити HTML “в лоб”, а спочатку перевірити внутрішні API-запити LCSC. Це швидше, стабільніше і простіше підтримувати при змінах сайту. Також заклав би збереження прогресу, повтори при помилках, логування і можливість перезапуску без втрати вже зібраних даних.

Мій стек: JavaScript/TypeScript, REST API, робота з даними та автоматизація. Можу зробити скрипт з ручним запуском, а при необхідності - підготувати варіант для щомісячного запуску.

Питання: вам потрібен тільки підсумковий XLSX після кожного запуску, чи також потрібен проміжний кеш/база, щоб при наступному запуску оновлювати дані швидше?

Maksim Sheptookha

0 0

Проєкти -
Оцінка -
Рейтинг 427

Бюджет: 16000 UAH Термін: 6 днів

Вітаю! Бачу, що бюджет проєкту дозволяє підійти до задачі серйозно. 650 000 товарів — це навантаження, яке вимагає побудови справжнього Data Pipeline, а не простого скрипта-парсера.
Моє рішення — це створення надійної системи збору даних, яка гарантовано допрацює до кінця, навіть якщо інтернет зникне або сайт тимчасово заблокує IP.

Чому моє рішення — це інвестиція, а не просто код:

1. Архітектура "Resumable Download": Найбільша проблема при зборі 650к записів — це переривання роботи. Мій софт зберігає стан черги в SQLite. Якщо скрипт впаде на 300-й тисячі, ви запустите його знову, і він продовжить з 300 001-го товару, а не почне з нуля.
2. Професійна робота з даними (Stream processing): Скрипт не перевантажує оперативну пам'ять (RAM). Він зчитує та записує дані потоково (streaming), тому навіть файл на сотні мегабайтів генерується на будь-якому VPS.
3. API-First підхід: Я не буду імітувати натискання кнопок. Скрипт працює безпосередньо з внутрішнім JSON API сайту. Це забезпечує максимальну швидкість (мілісекунди на запит) та довговічність (скрипт не "помре" при зміні дизайну сайту).
4. Масштабованість під доопрацювання: Код написаний на основі чистих PHP-класів (SOLID). Якщо структура даних на LCSC зміниться або вам знадобиться додати новий стовпець — це робиться зміною 3-4 рядків у конфігурації.
5. Захист від банів: Вбудована логіка ротації проксі, імітація "людських" пауз та обробка HTTP-помилок (429, 503), щоб обійти антифрод-системи LCSC.

• Технології: Pure PHP 8.x (CLI), Guzzle (Async), SQLite (state management), FastExcel.
• Вартість: 16 000 грн (повна розробка, налаштування логіки проксі та інструкція для запуску).
• Термін: 6 днів (з урахуванням часу на стрес-тести).

Я пропоную інженерну якість, яка позбавить вас необхідності наймати когось для підтримки цього скрипта в майбутньому. Готовий розпочати роботу!

Владислав Білокомиров

8 1

Проєкти 8
Оцінка 4.8
Рейтинг 2 409

Бюджет: 5000 UAH Термін: 3 дні

Вітаю!

Задача зрозуміла: потрібно регулярно збирати з LCSC всі товари “In Stock” по всіх розділах каталогу і вивантажувати їх у XLSX у чітко заданому форматі.

Що можу закрити:
— стабільний парсер під великий обсяг даних (~650 000 товарів) з проходом по всіх категоріях;
— вивантаження в Excel з потрібними колонками: розділ, MPN, Manufacturer, Availability, Description, Package, Pricing;
— запуск по кнопці або за розкладом + можливість подальшого доопрацювання, якщо структура каталогу зміниться.

Працюю з Python, великими парсингами, Excel-експортом і підтримкою таких скриптів, тому можу зробити не разовий збір, а робочий інструмент для регулярного використання.

Віталій Добрянський

2 0

Проєкти -
Оцінка -
Рейтинг 1 520

Бюджет: 3999 UAH Термін: 4 дні

Доброго дня!

Ознайомився з вашим ТЗ та прикріпленим прикладом файлу. Завдання зрозуміле: потрібен регулярний дамп каталогу LCSC.com (тільки товари "In Stock", близько 650к позицій) з правильною розбивкою оптової цінової сітки (Кількість/Ціна до 4 рівнів) у форматі XLSX.

Я Python-розробник і спеціалізуюсь на створенні високонавантажених парсерів та роботі з Data-pipeline.

Багато розробників пропонують парсити такі сайти через емуляцію браузера (Selenium), але на обсязі в 650 000 товарів це буде працювати добу.

Як я реалізую цей парсер (Архітектура рішення):

Робота безпосередньо з Backend API: LCSC.com динамічно підвантажує товари через приховані JSON API ендпоінти. Я напишу скрипт, який буде звертатися безпосередньо до цих API. Це прискорить збір даних у 100 разів.

Обхід ліміту в 5000 товарів: Платформа не дозволяє пролистати більше 50-100 сторінок пагінації за раз. Щоб витягнути всі 650к, я напишу алгоритм глибокого обходу (Deep Crawl), який буде рекурсивно провалюватися в підкатегорії та застосовувати мікро-фільтри, щоб у кожній вибірці було менше 5000 товарів.

Швидкість і стабільність: Я зберу скрипт на асинхронному руслі (Aiohttp/Asyncio). Прикрутимо ротацію проксі (проксі включимо в бюджет) і систему retry. Якщо LCSC тимчасово заблокує IP, парсер просто змінить проксі, почекає кілька секунд і продовжить роботу з місця обриву.

Формування XLSX: Динамічний парсинг цінової сітки (Pricing tiers) і запис у потрібний вам формат (8 стовпців для цін) через бібліотеку pandas. Файл не буде важити гігабайти і легко відкриється в Excel.

Скрипт буде забезпечений конфігом і детальним логгером (щоб ви бачили, який відсоток каталогу вже зібрано). При зміні структури сайту (якщо вони оновлять API), код легко масштабується і виправляється, оскільки я пишу в строгому ООП-стилі.

Готовий стартувати відразу. Напишіть у особисті повідомлення, і я покажу, як саме ми будемо витягувати матрицю цін!

Єгор Ульченко

25 1

Проєкти 25
Оцінка 4.8
Рейтинг 1 964

Бюджет: 2000 UAH Термін: 3 дні

Добрий день. Можу реалізувати такий парсер, а також його щомісячне обговорення (мануальне або автоматичне). Однак варто обговорити деталі. Давайте поспілкуємось в лс?

Тарас О.

4 0

Проєкти 4
Оцінка 5.0
Рейтинг 2 025

Бюджет: 1000 UAH Термін: 1 день

Привіт!

У мене великий досвід розробки рішень для парсингу та обробки даних (різні джерела, захист від блокувань, автоматизація). Готовий реалізувати поставлене завдання в найкоротші терміни.

Пропоную обговорити деталі в особистих повідомленнях.

Роман Пастухов

1 0

Проєкти -
Оцінка -
Рейтинг 702

Бюджет: 3500 UAH Термін: 3 дні

Вітаю! Готовий до співпраці. Маю досвід створення парсерів. Пропоную якісну та швидку роботу.
Пишіть)

Ігор Солоха

41 2

Проєкти 41
Оцінка -
Рейтинг 2 601

Бюджет: 1500 UAH Термін: 2 дні

МОжу допогти з виконанням, в них також є api що полегшує роботу

Матвій Марченко

20 0

Проєкти 20
Оцінка -
Рейтинг 2 092

Бюджет: 2000 UAH Термін: 2 дні

Доброго дня. Завдання зрозумів: потрібен скрипт, який при запуску обходить весь каталог lcsc.com по всіх розділах, бере тільки товари In Stock, близько 650 тисяч позицій, і експортує їх у XLSX з колонками розділ, MPN, виробник, наявність, опис, корпус і цінові пари кількість і ціна по чотирьох рівнях. Запускається раз на місяць або вручну, плюс можливість редагування під зміни структури каталогу.

Щодо реалізації: у lcsc є внутрішній JSON-API, який віддає каталог по сторінках, тому в першу чергу дивився б у бік роботи безпосередньо з цими запитами, а не парсингу HTML. Це і швидше, і стабільніше на обсязі в півмільйона позицій, і легше виправляти при змінах. Якщо частина даних закрита або захищена, додаю Selenium тільки на проблемні ділянки.

На обсязі 650 тисяч важлива стійкість, тому заклав би відновлення з місця обриву, контроль дублів по MPN, акуратні паузи і ретраї під антибот, при необхідності проксі, плюс прогрес у лог, щоб прогін можна було перезапускати без втрати зібраного. Експорт у XLSX через pandas або openpyxl з точною структурою колонок, що в ТЗ, включаючи чотири пари кількість і ціна.

Парсери на Python з Selenium, BeautifulSoup і pandas роблю давно. Щоб оцінити точніше: цінові рівні потрібні саме ті, що показані для роздрібної кількості, чи важливі всі ступені опту зі сторінки товару? Від цього залежить, скільки запитів на позицію. Готовий почати з розбору структури їх API на кількох розділах, щоб зафіксувати формат експорту і термін.

Dmytro Zmenkov

1 1

Проєкти -
Оцінка -
Рейтинг 121

Бюджет: 5000 UAH Термін: 1 день

Доброго дня. Готовий виконати цей проект, маю великий досвід розробки різних додатків.

Володимир Ч.

28 0

Проєкти 28
Оцінка 5.0
Рейтинг 1 466

Бюджет: 1000 UAH Термін: 1 день

готовий виконати ваше завдання, пишіть для обговорення деталей..........................

Ігор Погорєлов

5 0

Проєкти 5
Оцінка 5.0
Рейтинг 1 029

Бюджет: 700 UAH Термін: 1 день

Добрий день.

Подивився приклад файлу — структура зрозуміла, завдання чітке.

Пропоную Python-скрипт з двома режимами роботи:

1. Через LCSC API — якщо є доступ:
— Пакетні запити по 100–200 товарів за раз
— 650 000 товарів — близько 1–2 годин

2. Через Playwright (браузерний парсинг) — якщо API недоступний:
— Поштучно, обхід anti-bot захисту
— 650 000 товарів — 8–12 годин, рекомендую запуск на VPS

Що увійде в обох випадках:
— Обхід усіх розділів, фільтр «In Stock»
— Вивантаження 14 стовпців у форматі вашого прикладу
— Збереження прогресу (checkpoint) — при обриві скрипт продовжує з місця зупинки
— Документація та можливість правки при зміні структури сайту

Вартість: 8 000 – 12 000 грн. Термін: 5–7 днів.

Уточніть: чи є у вас доступ до LCSC API?

Rumzik Matvey

15 0

Проєкти 15
Оцінка 5.0
Рейтинг 3 857

Бюджет: 5000 UAH Термін: 2 дні

Доброго дня.
У мене великий досвід у парсингу, зокрема товарів з інтернет-магазинів, а не xml вивантажень.
Також парсив для себе авто- мото- запчастини та одяг з кількох джерел - де величезна кількість товарів.
Навіть мав досвід у парсингу бази даних СНД-сайтів.
Взагалі досвіду достатньо для виконання Вашого завдання якісно та в найкоротші терміни.
Завдання зрозуміле, можу приступити прямо зараз.

Назар К.

56 0

Проєкти 57
Оцінка 5.0
Рейтинг 2 628

Бюджет: 6500 UAH Термін: 3 дні

Доброго дня, щацікавив вашйи проект, давайте обговоримо деталі в чаті

Александр Баранников

4 0

Проєкти 4
Оцінка 5.0
Рейтинг 427

Бюджет: 2200 UAH Термін: 2 дні

Доброго вечора, готовий виконати ваше замовлення і буду радий подальшій співпраці. Пишіть сюди в лс, скину вам приклади своїх робіт. Ще можу скинути ссилку на портфоліо)

Михайло П.

123 0

Проєкти 125
Оцінка 5.0
Рейтинг 4 053

Бюджет: 2500 UAH Термін: 3 дні

Пишу парсери на Пітоні для різних, звертайтеся, все зробимо.

Єгор І.

86 0

Проєкти 86
Оцінка 5.0
Рейтинг 3 663

Бюджет: 2000 UAH Термін: 3 дні

Готовий взятися.
Треба уточнити деталі замовлення, пишіть!
Використовую python, uv, github, docker.

Roman Anatolievich B.

0 0

Проєкти -
Оцінка -
Рейтинг 318

Бюджет: 2000 UAH Термін: 2 дні

Вже зробив скрипт на Python. Там мільйони товарів. Доведеться розбивати на файли. І робити паузи між запитами на сайт, бо заблокують. Можу показати готовий файл на 800 товарів. Звертайтеся для уточнення кінцевого результату.

Денис Гаврищук

32 1

Проєкти 32
Оцінка 5.0
Рейтинг 1 815

Бюджет: 2000 UAH Термін: 2 дні

Добрий день, веб-програмуванню вже більше 9 років
Працюю з rest api, фреймворками та cms такими як django, laravel, yii2, wp, opencart, codeigniter тощо. Готовий виконати завдання.
Відгуки: Freelancehunt

Andrii Y.

1 1

Проєкти -
Оцінка -
Рейтинг 246

Бюджет: 1000 UAH Термін: 3 дні

Доброго дня, готовий взятися за проект, досвід є, чекаю на відповідь.

Nick Osipov

41 4

Проєкти 43
Оцінка 4.6
Рейтинг 4 938

Бюджет: 1000 UAH Термін: 3 дні

Доброго дня!
Спеціалізуюсь на розробці парсерів та автоматизації. Готовий реалізувати парсер LCSC.com на Python для регулярного збору актуальних "In Stock" товарів у XLSX, з можливістю подальшої підтримки. Маю досвід роботи з веб-скрейпінгом та великими об'ємами даних.

Напишіть в лс, уточнимо деталі.

Макс Блищик

0 0

Проєкти -
Оцінка -
Рейтинг 321

Бюджет: 2999 UAH Термін: 3 дні

Вітаю!

Ознайомився з вашим завданням та переглянув прикріплений приклад CSV-файлу. Завдання повністю зрозуміле — потрібно написати парсер для сайту lcsc.com, який збере необхідні дані по компонентах і точно відтворить потрібну вам структуру таблиці.

Як я це реалізую:
Напишу надійний скрипт на Python. Якщо сайт використовує динамічне підвантаження або захист, використаю інструменти для імітації реального браузера, щоб уникнути блокувань. Скрипт автоматично проходитиме по категоріях/посиланнях, збиратиме артикули, ціни та інші характеристики, після чого формуватиме готовий файл (CSV/Excel) рівно за вашим шаблоном.

Код буде чистим і задокументованим, щоб ви могли запускати його самостійно в майбутньому. За потреби можу запакувати все в Docker.

Уточнювальне запитання:
Парсинг потрібен одноразово (просто зібрати базу на зараз), чи цей скрипт має запускатися регулярно для оновлення залишків та цін?

Микола Єфімов

77 1

Проєкти 78
Оцінка 5.0
Рейтинг 2 778

Бюджет: 2000 UAH Термін: 2 дні

Доброго дня. З сайтом ознайомився. Можу наисати парсер який буде потрібні вам дані в табицю Ексель.

Олег Поляков

52 0

Проєкти 55
Оцінка 5.0
Рейтинг 1 890

Бюджет: 20000 UAH Термін: 20 днів

Добрий день. Можу написати консольну програму для парсингу цих товарів на python. Вкладений файл чомусь не відкривається - можете повторно надіслати в лс?

Ihor B.

20 0

Проєкти 20
Оцінка 5.0
Рейтинг 1 744

Бюджет: 11108 UAH Термін: 7 днів

Напишу парсер, розміщую на своїх ресурсах з подальшою підтримкою. Для збору такого кількості потрібні проксі, включаються в підтримку. Також сайт віддає не більше 5000 товарів за раз, потрібна розбивка по фільтрам. Пишіть, обговоримо деталі.

Геннадій Я.

32 0

Проєкти 33
Оцінка 5.0
Рейтинг 3 388

Бюджет: 1500 UAH Термін: 1 день

Вітаю!
Напишу скрипт під ваші потреби, котрий буде проходить по сторінкам пагінації усіх розділів і отримувати інформацію про наявність та ціни на товари

Данило Канівець

54 1

Проєкти 55
Оцінка 5.0
Рейтинг 4 968

Бюджет: 1600 UAH Термін: 1 день

Привіт, я Python-розробник, маю досвід у розробці парсерів різної складності. Можу виконати ваш проект швидко та якісно. Пишіть - обговоримо деталі. Приступити до роботи готовий вже сьогодні.

Александр З.

164 1

Проєкти 167
Оцінка 5.0
Рейтинг 6 747

Бюджет: 1500 UAH Термін: 1 день

Добрий день, можу зробити програму і віддати Вам, або можу збирати дані за Вашим запитом. Пишіть, обговоримо.

Volodymyr S.

9 1

Проєкти 9
Оцінка 5.0
Рейтинг 726

Бюджет: 2000 UAH Термін: 3 дні

Привіт! Я уважно вивчив ваш проект і готовий розпочати його реалізацію. Давайте обговоримо деталі для найкращого виконання.

Vadim Nemtsev
Харків, Україна

Проєктів -
Оцінка -
Рейтинг 85

Богдан Мельник

Volodymyr H.

Віталій Жовнірчик

Александр Стинковый

Андрей К.

Артем Плаха

Дмитро Кримов

Микола Ф.

Maksim Sheptookha

Владислав Білокомиров

Віталій Добрянський

Єгор Ульченко

Тарас О.

Роман Пастухов

Ігор Солоха

Матвій Марченко

Dmytro Zmenkov

Володимир Ч.

Ігор Погорєлов

Rumzik Matvey

Назар К.

Александр Баранников

Михайло П.

Єгор І.

Roman Anatolievich B.

Денис Гаврищук

Andrii Y.

Nick Osipov

Макс Блищик

Микола Єфімов

Олег Поляков

Ihor B.

Геннадій Я.

Данило Канівець

Александр З.

Volodymyr S.

Ставки приховані

Ставки поки відсутні

Актуальні фриланс-проєкти в категорії Парсинг даних