Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Розмістіть свій проєкт безплатно та почніть отримувати пропозиції від фрилансерів-виконавців уже через хвилини після публікації!

Нужно спарсить интернет магазин


  1. 548    11  0
    179 днів333 UAH

    Напишите в ЛС этот "сложный интернет магазин", после ознакомления смогу сделать конкретное предложение.

  2. 428    3  0
    10 днів299 000 UAH

    В принципе, если потратится на достаточно мощный комп, то это вполне посильная задача.

  3. Ще 2 ставки приховано
  • Олег Б.
    4 грудня 2019, 21:59 |

    Вам треба дуже багато оперативки, і дуже багато ядер, якщо ви хочети парсити за допомогою Selenium, на такій швидкості.

  • Леонід Б.
    4 грудня 2019, 22:05 |

    Так вам нужен не парсинг, а ПАРСЕР. Изменить название проекта, не вводите в заблуждение фрилансеров.

  • Виктор Семенов
    4 грудня 2019, 22:30 |

    Я думаю это не принципиально. 

  • Іван Якушенко
    4 грудня 2019, 22:23 |

    Запросы и код обфусцирован

    Это вы так сказали? Как по-вашему тогда клиент (сайт) эти запросы читает и рендерит в html? Что бы нормально работать с несколькими инстансами selenium нужен не многопоток, а многопроцессорность, ибо вы запустив пару инстансов упретесь в потолок производительности ядра, параллельные вычисления на node - боль, никто такими костылями даже за вменяемые деньги не будет. Найдите нормального программиста, который не будет вам рассказывать сказки про обфусцированные запросы и городить ерунду про многопоточный node и selenium.

    С уважением.

  • Виктор Семенов
    4 грудня 2019, 22:29 |

    Скажите что Вы можете предложить? 

    В принципе сервера не проблема, купим столько сколько нужно

  • Іван Якушенко
    4 грудня 2019, 22:33 |

    Могу сделать ставку, напишите мне в ЛС сайт, я посмотрю и тогда что-то предложу. Я несколько лет занимаюсь парсерами и сбором данных и видал все эти "обфусцированные запросы". Работаю на Python/C#. Если возьмусь за работу то никаких модных словечек в коде типа mocha, chai, webpack и прочее вы не получите, но вы получите результат.

  • Профіль заблоковано
    5 грудня 2019, 23:45 |

    А это вообще возможно - Парсить нужно тысячи товаров каждые 1-5 секунд  ?

    Даже однократно это будет за гранью, а постоянно  - это как вам видится?

  • Олег Б.
    5 грудня 2019, 23:48 |

    щось подібне на дос атаку)

  • Іван Якушенко
    5 грудня 2019, 23:56 |

    Про параллельные вычисления не слыхали?

  • Олег Б.
    6 грудня 2019, 0:11 |

    А толку тут від них(це ті самі потоки по суті)?

  • Іван Якушенко
    6 грудня 2019, 0:20 |

    Потоки - это одна из разновидностей параллельных вычислений.

    Что значит какой толк? Берешь 1000 ссылок и одновременно их парсишь, при наличии соответствующего интернет-канала.

  • Олег Б.
    6 грудня 2019, 0:28 |

    Попробуй відкрити тисячу вкладок в браузері, і подивися на диспечер задач

  • Олег Б.
    6 грудня 2019, 0:28 |

    з сайтами

  • Іван Якушенко
    6 грудня 2019, 0:42 |

    А браузер тут каким боком?

  • Олег Б.
    6 грудня 2019, 0:44 |

    Ну якщо ти не через браузер будеш парсити то ніяких

    Прямими запросами до сервера це вприниципі реально

  • Олег Б.
    6 грудня 2019, 0:46 |

    ну це вже досом вприниципі можна важати)1000 запросів в секунду чи даже 5

  • Профіль заблоковано
    6 грудня 2019, 8:38 |

    Я имел ввиду - как сервер это отдаст и как поведёт себя серверный анализатор ботов?

  • Профіль видалено
    7 грудня 2019, 2:18 |

    на зеннопостере такое потянет на 5 серверах .на каждом по 200 браузерных потоков.сам делаю масштабные проекты.протестировано уже многократно и это получше будет чем извращение с селениумом.на 1 инстанс идет 100-100 мбайт памяти оперативной.проц грузит 80%  при 200 потоках браузера

  • Профіль заблоковано
    7 грудня 2019, 8:11 |

    И сервер это не блокирует, 1000 потоков ? И владелец согласен на такой бессмысленный трафик? Вы кого парсите - деревенский сельсовет?

  • Іван Якушенко
    7 грудня 2019, 12:08 |

    И как сервер их заблокирует, если использовать прокси?

  • Іван Якушенко
    7 грудня 2019, 12:08 |

    Что за чушь. Использовать 5 каких-то серверов для всего-то 1000 потоков. Про асинхронный код и корутины не слыхали? И это ты называешь "масштабными"? 

  • Олег Б.
    7 грудня 2019, 13:06 |

    Люди забийте на цей проект!

    Скидав заказчик пару днів назад, приклад сайту який потрібно парсити, то цей сайт купляє дані в міжнародних компаній, і від того що ви будете парсити цей сайт , вони будуть мати не погані збитки(1 секунда == 1000 запросів).

Актуальні фриланс-проєкти в категорії Парсинг даних

Требуется спеціаліст з просування в Telegram.

1285 UAH

Завдання: інвайт реальних користувачів за базою юзернеймів у нові чати та розсилка повідомлень по цільовій базі. Цікавить тільки якісний трафік і робота з живою аудиторією — виконавців, які використовують ботів, накрутку або неякісні методи, прохання НЕ БЕСПОКІТЬ. Робота…

Парсинг данихПросування у соціальних мережах (SMM) ∙ 4 дні тому ∙ 8 ставок

Консультація по парсингу підписників Instagram-акаунтів

Доброго дня. Необхідно провести попередню оцінку можливості виконання наступного завдання. У мене є список Instagram-акаунтів. Мета — отримати контактні дані (в першу чергу email-адреси) користувачів, які підписані на ці акаунти. Раніше мені зустрічалися компанії та сервіси, які…

Парсинг даних ∙ 7 днів 19 годин тому ∙ 13 ставок

Потрібен спеціаліст для пошуку контактів ЛПР по Україні

Необхідно зібрати базу (чи готова база) контактів осіб, які приймають рішення (ЛПР), у компаніях України.

Збір інформаціїПарсинг даних ∙ 7 днів 23 години тому ∙ 21 ставка

Потрібно спартити дані з Linkedin

Потрібно спартити дані з Linkedin по нашому списку. Для кожного запису потрібно знайти та зібрати доступні дані якщо такі є на Linkedin профілі включаючи фотографію профілю на соц мережі Lihnkedin, email-адресу, посилання на соціальні мережі, вебсайт компанії, номер телефону.…

Парсинг даних ∙ 8 днів 5 годин тому ∙ 28 ставок

Парсинг та класифікація даних

Шукаємо розробника для реалізації системи збору та структурування даних з відкритих джерел. Маємо базу власників малого бізнесу в США, яка містить ім’я людини, назву компанії, адресу та штат. Необхідно побудувати процес збагачення цих записів додатковою інформацією з публічно…

Веб-програмуванняПарсинг даних ∙ 8 днів 6 годин тому ∙ 45 ставок

Замовник
Проєкт опублікований
6 років тому
203 перегляди