Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!

Нужно спарсить интернет магазин


  1. 548    11  0
    179 дней333 UAH

    Напишите в ЛС этот "сложный интернет магазин", после ознакомления смогу сделать конкретное предложение.

  2. 428    3  0
    10 дней299 000 UAH

    В принципе, если потратится на достаточно мощный комп, то это вполне посильная задача.

  3. Еще 2 ставки скрыты
  • Олег Б.
    4 декабря 2019, 21:59 |

    Вам треба дуже багато оперативки, і дуже багато ядер, якщо ви хочети парсити за допомогою Selenium, на такій швидкості.

  • Леонід Б.
    4 декабря 2019, 22:05 |

    Так вам нужен не парсинг, а ПАРСЕР. Изменить название проекта, не вводите в заблуждение фрилансеров.

  • Виктор Семенов
    4 декабря 2019, 22:30 |

    Я думаю это не принципиально. 

  • Іван Якушенко
    4 декабря 2019, 22:23 |

    Запросы и код обфусцирован

    Это вы так сказали? Как по-вашему тогда клиент (сайт) эти запросы читает и рендерит в html? Что бы нормально работать с несколькими инстансами selenium нужен не многопоток, а многопроцессорность, ибо вы запустив пару инстансов упретесь в потолок производительности ядра, параллельные вычисления на node - боль, никто такими костылями даже за вменяемые деньги не будет. Найдите нормального программиста, который не будет вам рассказывать сказки про обфусцированные запросы и городить ерунду про многопоточный node и selenium.

    С уважением.

  • Виктор Семенов
    4 декабря 2019, 22:29 |

    Скажите что Вы можете предложить? 

    В принципе сервера не проблема, купим столько сколько нужно

  • Іван Якушенко
    4 декабря 2019, 22:33 |

    Могу сделать ставку, напишите мне в ЛС сайт, я посмотрю и тогда что-то предложу. Я несколько лет занимаюсь парсерами и сбором данных и видал все эти "обфусцированные запросы". Работаю на Python/C#. Если возьмусь за работу то никаких модных словечек в коде типа mocha, chai, webpack и прочее вы не получите, но вы получите результат.

  • Профиль заблокирован
    5 декабря 2019, 23:45 |

    А это вообще возможно - Парсить нужно тысячи товаров каждые 1-5 секунд  ?

    Даже однократно это будет за гранью, а постоянно  - это как вам видится?

  • Олег Б.
    5 декабря 2019, 23:48 |

    щось подібне на дос атаку)

  • Іван Якушенко
    5 декабря 2019, 23:56 |

    Про параллельные вычисления не слыхали?

  • Олег Б.
    6 декабря 2019, 0:11 |

    А толку тут від них(це ті самі потоки по суті)?

  • Іван Якушенко
    6 декабря 2019, 0:20 |

    Потоки - это одна из разновидностей параллельных вычислений.

    Что значит какой толк? Берешь 1000 ссылок и одновременно их парсишь, при наличии соответствующего интернет-канала.

  • Олег Б.
    6 декабря 2019, 0:28 |

    Попробуй відкрити тисячу вкладок в браузері, і подивися на диспечер задач

  • Олег Б.
    6 декабря 2019, 0:28 |

    з сайтами

  • Іван Якушенко
    6 декабря 2019, 0:42 |

    А браузер тут каким боком?

  • Олег Б.
    6 декабря 2019, 0:44 |

    Ну якщо ти не через браузер будеш парсити то ніяких

    Прямими запросами до сервера це вприниципі реально

  • Олег Б.
    6 декабря 2019, 0:46 |

    ну це вже досом вприниципі можна важати)1000 запросів в секунду чи даже 5

  • Профиль заблокирован
    6 декабря 2019, 8:38 |

    Я имел ввиду - как сервер это отдаст и как поведёт себя серверный анализатор ботов?

  • Профиль удален
    7 декабря 2019, 2:18 |

    на зеннопостере такое потянет на 5 серверах .на каждом по 200 браузерных потоков.сам делаю масштабные проекты.протестировано уже многократно и это получше будет чем извращение с селениумом.на 1 инстанс идет 100-100 мбайт памяти оперативной.проц грузит 80%  при 200 потоках браузера

  • Профиль заблокирован
    7 декабря 2019, 8:11 |

    И сервер это не блокирует, 1000 потоков ? И владелец согласен на такой бессмысленный трафик? Вы кого парсите - деревенский сельсовет?

  • Іван Якушенко
    7 декабря 2019, 12:08 |

    И как сервер их заблокирует, если использовать прокси?

  • Іван Якушенко
    7 декабря 2019, 12:08 |

    Что за чушь. Использовать 5 каких-то серверов для всего-то 1000 потоков. Про асинхронный код и корутины не слыхали? И это ты называешь "масштабными"? 

  • Олег Б.
    7 декабря 2019, 13:06 |

    Люди забийте на цей проект!

    Скидав заказчик пару днів назад, приклад сайту який потрібно парсити, то цей сайт купляє дані в міжнародних компаній, і від того що ви будете парсити цей сайт , вони будуть мати не погані збитки(1 секунда == 1000 запросів).

Актуальные фриланс-проекты в категории Парсинг данных

Консультация по парсингу подписчиков Instagram-аккаунтов

Здравствуйте. Необходимо провести предварительную оценку возможности выполнения следующей задачи. У меня есть список Instagram-аккаунтов. Цель — получить контактные данные (в первую очередь email-адреса) пользователей, которые подписаны на эти аккаунты. Ранее мне встречались…

Парсинг данных ∙ 3 дня 9 часов назад ∙ 12 ставок

Нужен специалист для поиска контактов ЛПР по Украине

Необходимо собрать базу (или готовую базу) контактов лиц, принимающих решения (ЛПР), в компаниях Украины.

Поиск и сбор информацииПарсинг данных ∙ 3 дня 14 часов назад ∙ 17 ставок

Необходимо спарсить данные из Linkedin

Необходимо спарсить данные с Linkedin по нашему списку. Для каждой записи нужно найти и собрать доступные данные, если такие есть на Linkedin профиле, включая фотографию профиля в соцсети Linkedin, email-адрес, ссылки на социальные сети, вебсайт компании, номер телефона. Все…

Парсинг данных ∙ 3 дня 20 часов назад ∙ 27 ставок

Парсинг и классификация данных

Ищем разработчика для реализации системы сбора и структурирования данных из открытых источников. У нас есть база владельцев малого бизнеса в США, которая содержит имя человека, название компании, адрес и штат. Необходимо построить процесс обогащения этих записей дополнительной…

Веб-программированиеПарсинг данных ∙ 3 дня 21 час назад ∙ 41 ставка

Свитлагата

750 UAH

Необходимо импортировать 1819 товаров из XML/YML-фида Prom.ua в OpenCart 3. Есть готовый XML-файл, который содержит названия товаров, описания, цены, фотографии, характеристики, производителей и категории. Необходимо: импортировать все товары в OpenCart 3; создать и…

CMSПарсинг данных ∙ 5 дней назад ∙ 34 ставки

Заказчик
Проект опубликован
6 лет назад
203 просмотра