Парсинг каталогу з драйверами
Алгоритм скрипту:Wget завантажує всі файли Sitemap.xml, які вказані в robots.txt сайтуКонвертує файли Sitemap.xml в CSV форматWget завантажує HTML-файли з CSVGrep очищає HTML-код від сміття (за регулярними правилами)Зберігає файли на HDD
Примітка: зображення, CSS та іншу статику завантажувати не потрібно, завантажуємо тільки вміст HTML-файлів.
Вимоги: Підтримка багатоточності для керування швидкістю парсінга, вибравши кількість одночасних скачок.
Артефакти:Адреса сайту, який парсим (це завжди один і той же URL)Структура SitemapСтруктура кінцевих папокРегулярні вирази для очищення від сміття
Відгук замовника про співпрацю з Сергеєм Пасиногою
Парсинг каталогу з драйверамиЯк завжди у Сергія все зроблено на відмінному рівні, всі пункти ТЗ виконані, по всьому дані пояснення і навіть зроблено корисні фічі над покладеним - все чудово!
Відгук фрилансера про співпрацю з Sam B.
Парсинг каталогу з драйверамиДуже задоволений співпрацею! Ми спільно вже не виконуємо перший проект.
Все на вищому рівні, зв'язок, супровід за проектом, чіткі вимоги і т.д.
Дуже професійний і якісний підхід до роботи. Всім рекомендую!
-
Добрий день ! Я можу написати проект на Java, звертайтеся.
За деталями напишіть в ЛС.
-
115 34 4 2 Привітання
Я можу створити Java для вашого проекту
Ви можете запустити на будь-який ОС.
-
1298 26 2 Готовий піти на роботу хоча б сьогодні.
Що я можу надати?
Портфоліо на інших біржах
- Резюме
Гітхаб з проектами
Працювати бажано через безпечну угоду. Скрипт написані в Python або PHP
Актуальні фриланс-проєкти в категорії Парсинг даних
Svitlahata
750 UAH
Потрібно імпортувати 1819 товарів із XML/YML-фіду Prom.ua до OpenCart 3. Є готовий XML-файл, який містить назви товарів, описи, ціни, фотографії, характеристики, виробників та категорії. Необхідно: імпортувати всі товари до OpenCart 3; створити та прив’язати категорії;… CMS, Парсинг даних ∙ 2 години 9 хвилин тому ∙ 18 ставок |
Парсинг даних через мобільне APIШукаю людину з досвідом парсингу даних через мобільне API, для парсингу e-commerce, rozetka та аналоги Завдання: 1. Перехоплення трафіку мобільного додатку (Android) налаштування проксі, аналіз запитів 2. Визначення потрібних API endpoints, куди йдуть запити, які headers… Python, Парсинг даних ∙ 1 день 20 годин тому ∙ 28 ставок |
Шукаю програміста або вайб-кодера для автоматизації збору даних 2https://drive.google.com/file/d/14tP5XWJB9acV4gn_cJrFwMpihUj3EbQz/view?usp=sharing я випадково на ту ссылку послав Веб-програмування, Парсинг даних ∙ 1 день 23 години тому ∙ 37 ставок |
Створити дашборд у https://airtable.com/ по результативності рекламних креативів з facebook adsПовноцінне ТЗ https://docs.google.com/document/d/1_n_oYRNZWYxalUA---DM5AD1b5ZSrtePw5J4G42svGw/edit?usp=sharing Бази даних та SQL, Парсинг даних ∙ 6 днів 17 годин тому ∙ 20 ставок |
Створення файлу Exel для завантаження товарів на сайти інших партнерів.Мене цікавить щоб зробити табличку Exel з повністю всіма параметрами. Ось сайт -https://heiztechnik.com.ua/ І позиціії які цікавлять щоб були перенесенні : Ручні котли : 1) TIS UNI 15-95 кВт(10) шт 2)TIS HARD 150-500 кВт(7) шт Пелетні котли: 1)TIS PELLET 15-95 кВт(10) шт 2)TIS… Парсинг даних ∙ 6 днів 21 година тому ∙ 38 ставок |