Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Розмістіть свій проєкт безплатно та почніть отримувати пропозиції від фрилансерів-виконавців уже через хвилини після публікації!

Парсінг категорії Амазонка

Translated3000 UAH

Відгук замовника про співпрацю з Andrii Shmagala

Якість
Професіоналізм
Вартість
Контактність
Терміни

Більшу частину роботи було виконано, людина завжди була на зв'язку. В цілому можна працювати, але рекомендую якомога чітко обговорювати терміни і критерії завершення замовлення.

Відгук фрилансера про співпрацю з Evgeniy K

Оплата
Постановка завдання
Чіткість вимог
Контактність

Дякую за співпрацю, робота затягнулася довше ніж я планував спочатку

  1. 2311    53  4   2
    Переможець3 дні3000 UAH

    Доброго дня!
    Спаршу категорій за допоогою python selenium
    вже парсив amazon і не один раз

  2. 1 ставку приховано
  • Володимир Калач
    21 вересня 2023, 12:21 |

    Можете надати приклад результату роботи.
    наприклад 3 категорії та всю інформацыю по ним, яку ви хочете бачити.
    дуже цікавить як інформація так і спосіб розміщення в таблиці.

  • Володимир Калач
    21 вересня 2023, 12:26 |

    до речі.
    на Amazon.DE станом на 2019-05-20 було 50576 категорій
    на америці 172025 категорій.


  • Evgeniy K
    21 вересня 2023, 12:50 |

    Доброго дня!

    Результат потрібен в .csv або json форматі (як зручніше вам).

    Для кожної категорії потрібен - id, url, список фільтрів (json назва фільтра та список доступних опцій всередині), мінімальна, середня, та максимальна ціна на трьох видача - дефолтній, та за сортуваннями по ціні (числа), для кожної з трьох видач, що ми парсимо - json масив з товарів на ній (назва, зображення, url, ціна). Усі дані наявні на сторінці категорії, додатково парсити сторінки товарів не потрібно.

    Якщо можливо також - кількість товарів в кожній категорії (можливо амазон десь вказує просто число).


    Хм, можливо дійсно категорій більше - тоді і парсити теж більше потрібно ніж 25к категорій.

  • Володимир Калач
    21 вересня 2023, 12:54 |

    наданий Вами зразок (для 3х категрорій) з id, url, список фільтрів ...
    зробить спілкування більш об"єктивним.

  • Evgeniy K
    22 вересня 2023, 22:40 |

    Ось приклад в JSON 

    {

      "name": "Garden hoses",

      "node_id": "553966",

      "parent_node_id": "00001",

      "link": "https://www.amazon.com/Garden-Hoss/b?ie=UTF8&node=553966",

      "products_count": 1046,

      "filters": {

        "Featured Brands": [

          "Flexzilla",

          "Graco"
         .....

        ],

        "Hose Length": [

          "14 Feet & Under",

          "15 to 24 Feet"

          ...

        ],

        "Hose material": [

          "Polyurethane",

          "Rubber",

          "Vinyl"

        ]

        // *Інші фільтри з усіма варіантами відповідей*

      },

      "default_sort": { // дані з першої сторінки даної категорії з дефолтним сортуванням

        "min_price": 2,

        "max_price": 2,

        "avg_price": 2,

        "items": [

          {

            "id": "B014M9PEXC",

            "name": "zero-G 4001-100 Garden Hose, 5/8 x 100', Gray",

            "link": "https://www.amazon.com/4001-50-Lightweight-Flexible-Durable-Kink-Free/dp/B014M9PEXC/",

            "imgs": {

              "1x" : "https://m.media-amazon.com/images/I/81Z8yBjgfaL._AC_UL320_.jpg",

              "1.5x" : "https://m.media-amazon.com/images/I/81Z8yBjgfaL._AC_UL320_.jpg",

              "2x" : "https://m.media-amazon.com/images/I/81Z8yBjgfaL._AC_UL320_.jpg"

            },

            "price": "126"

          }

          // *Інші доступні товари на першій сторінці за даним сортуванням*

        ]

      },

      "asc_sort": {// дані з першої сторінки даної категорії з сортуванням за зростанням ціни

        "min_price": 34534,

        "max_price": 356,

        "avg_price": 22344,

        "items": [

          {

            "id": "B014M9PEXC",

            "name": "zero-G 4001-100 Garden Hose, 5/8 x 100', Gray",

            "link": "https://www.amazon.com/4001-50-Lightweight-Flexible-Durable-Kink-Free/dp/B014M9PEXC/",

            "imgs": {

              "1x" : "https://m.media-amazon.com/images/I/81Z8yBjgfaL._AC_UL320_.jpg",

              "1.5x" : "https://m.media-amazon.com/images/I/81Z8yBjgfaL._AC_UL320_.jpg",

              "2x" : "https://m.media-amazon.com/images/I/81Z8yBjgfaL._AC_UL320_.jpg"

            },

            "price": "126"

          }

          // *Інші доступні товари на першій сторінці за даним сортуванням*

        ]

      },

      "desc_sort": { // дані з першої сторінки даної категорії з сортуванням за зменшенням ціни

        "min_price": 3,

        "max_price": 4,

        "avg_price": 6,

        "items": [

          {

            "id": "B014M9PEXC",

            "name": "zero-G 4001-100 Garden Hose, 5/8 x 100', Gray",

            "link": "https://www.amazon.com/4001-50-Lightweight-Flexible-Durable-Kink-Free/dp/B014M9PEXC/",

            "imgs": {

              "1x" : "https://m.media-amazon.com/images/I/81Z8yBjgfaL._AC_UL320_.jpg",

              "1.5x" : "https://m.media-amazon.com/images/I/81Z8yBjgfaL._AC_UL320_.jpg",

              "2x" : "https://m.media-amazon.com/images/I/81Z8yBjgfaL._AC_UL320_.jpg"

              // *інші наявні розміри зображення в картці товару*

            },

            "price": "126"

          }

          // *Інші доступні товари на першій сторінці за даним сортуванням*

        ]

      }

    }

  • Ivan Hrytskiv
    21 вересня 2023, 12:55 |

    Как результат,  нужен примерно такой файл (это кстати актуальный полный список категорий амазона):

    https://drive.google.com/file/d/1kI0X_XWwjuCvylnfJKeOu8IMurjDvrBW/view?usp=sharing

    Це ви серйозно ?)))))))))))))))))))))))
    це тілька маленька частина категорій амазону ))))))))))))
    до повного списку тут ще кравлити і кравлити )))))))))

  • Evgeniy K
    21 вересня 2023, 13:00 |

    да, уже понял, странно что этот список заявили как полный. Интересно, чего не хватает - в глубину или в ширину

  • Володимир Калач
    21 вересня 2023, 13:07 |

    я помилився. це в німеччині 172025   стільки категорій. в Америці дещо більше.

  • Ivan Hrytskiv
    21 вересня 2023, 13:09 |

    Наскільки я встиг подивитись - то , І в ширину і в глибину. 

    І якщо хтось Вам пропонує селеніумом парсити категорії - ну... це принаймі смішно і не рентабельно.

    При мульти процесорності та паралельності звичайними запитами , які не блокаються амазоном - це займає 27 годин .

    І навіть за цей час встигають появлятись нові категорії. А урли на деякі категорії і їх підкатегорії - уже будуть не актуальними. Тому, що або змінили свої урли , або ж уже не існують.

    Тому в завдання потрібно вказувати- що зібрати якусь частину дерева категорій - в глиб стільки то нодів, в ширину - стільки то .

  • Evgeniy K
    21 вересня 2023, 13:20 |

    Мене цікавить максимально глибоке та широке дерево (якщо якась частина категорій втратить актуальність це не проблема). За скільки ви б взялися за поставлене завдання з урахуванням необхідних даних?

  • Володимир Калач
    21 вересня 2023, 15:07 |

    пару років назад через amazon MWS  (API)
    був доступний звіт _GET_XML_BROWSE_TREE_DATA_
    цей звіт віддавав список ВСІХ категорій на маркетплейсі.
    наразі цей звіт застарів
    ( апі повертає відповідь  

    <Message>Requested report type is deprecated in MWS</Message>

    )

Актуальні фриланс-проєкти в категорії Парсинг даних

Консультація по парсингу підписників Instagram-акаунтів

Доброго дня. Необхідно провести попередню оцінку можливості виконання наступного завдання. У мене є список Instagram-акаунтів. Мета — отримати контактні дані (в першу чергу email-адреси) користувачів, які підписані на ці акаунти. Раніше мені зустрічалися компанії та сервіси, які…

Парсинг даних ∙ 2 дні 16 годин тому ∙ 12 ставок

Потрібен спеціаліст для пошуку контактів ЛПР по Україні

Необхідно зібрати базу (чи готова база) контактів осіб, які приймають рішення (ЛПР), у компаніях України.

Збір інформаціїПарсинг даних ∙ 2 дні 20 годин тому ∙ 17 ставок

Потрібно спартити дані з Linkedin

Потрібно спартити дані з Linkedin по нашому списку. Для кожного запису потрібно знайти та зібрати доступні дані якщо такі є на Linkedin профілі включаючи фотографію профілю на соц мережі Lihnkedin, email-адресу, посилання на соціальні мережі, вебсайт компанії, номер телефону.…

Парсинг даних ∙ 3 дні 2 години тому ∙ 27 ставок

Парсинг та класифікація даних

Шукаємо розробника для реалізації системи збору та структурування даних з відкритих джерел. Маємо базу власників малого бізнесу в США, яка містить ім’я людини, назву компанії, адресу та штат. Необхідно побудувати процес збагачення цих записів додатковою інформацією з публічно…

Веб-програмуванняПарсинг даних ∙ 3 дні 3 години тому ∙ 41 ставка

Svitlahata

750 UAH

Потрібно імпортувати 1819 товарів із XML/YML-фіду Prom.ua до OpenCart 3. Є готовий XML-файл, який містить назви товарів, описи, ціни, фотографії, характеристики, виробників та категорії. Необхідно: імпортувати всі товари до OpenCart 3; створити та прив’язати категорії;…

CMSПарсинг даних ∙ 4 дні 6 годин тому ∙ 34 ставки

Замовник
Evgeniy K
Україна Київ  5  0
Проєкт опублікований
2 роки тому
120 переглядів