Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!

Разработать парсер (python)


  1. 190    1  0   1
    1 день100 UAH

    Добрый день.
    Давайте пообщаемся и всё обсудим.
    Опыт, работы в личку

  2. Еще 3 ставки скрыты
    1 ставка скрыта
  • Анатолий Безмощук
    6 июля 2018, 11:42 |

    К сожалению beautifulsoup не умеет парсить динамические сайты (контент подгружается через javascript) так как не умеет выполнять эти сценарии.

  • Игорь Виценко Webmaxstudio
    6 июля 2018, 11:44 |

    Спасибо за комментарий! Нам это известно, с динамическими данными справиться selenium

  • Анатолий Безмощук
    6 июля 2018, 11:47 |

    Такое себе, медленный довольно, даже на C#, не говоря уже про Python

  • Игорь Виценко Webmaxstudio
    6 июля 2018, 11:49 |

    Какие решения на Ваш взгляд лучше?

  • Анатолий Безмощук
    6 июля 2018, 11:51 |

    Честно говоря на пайтон я не смог найти достойного решения для динамечиских сайтов. Вот BeautifulSoup4 + requests это просто крутое сочитание для статики. А с динамикой я не находил достойных модулей

  • Профиль удален
    6 июля 2018, 11:53 |

    А зачем ему скорость? Не думаю что там что-то будет появляться каждую долю секунды

  • Игорь Виценко Webmaxstudio
    6 июля 2018, 11:55 |

    Коэффициенты могут меняться каждую секунду

  • Профиль удален
    6 июля 2018, 11:56 |

    Ну а с интернетом тут вас как? Скорость позволит быстро загружать страницы?

  • Игорь Виценко Webmaxstudio
    6 июля 2018, 12:06 |

    Да, это не проблема
    По сути страницу нужно загрузить 1 раз и постоянно по ней проходиться и передавать данные (для некоторых сайтов страниц может быть несколько)
    Парсер должен работать без остановки 24\7 и передавать данные с минимальной задержкой

  • Анатолий Безмощук
    6 июля 2018, 11:58 |

    ну да для вытягивания одной несчастной ссылки с одной странички скоросто особо не нужна. Задачи бывают разные. Я к примеру пытался поймать определенный товар на торговой площадке который было нереально поймать вручную и для таких задач он медленный довольно + браузер открыт это забирает как скорость на загрузку лишних картинок, так и оперативу. Или если сайтов к примеру 1000 и нужно пропарсить много страниц и вытащить много данных. Сколько такая прога работать будет? 2 дня? 5? Скорость важна всегда

  • Профиль удален
    6 июля 2018, 12:02 |

    Я 40к страниц парсил Сплинтером(это доработка селениум, или как это назвать)

    Заняло день

  • Анатолий Безмощук
    6 июля 2018, 12:04 |

    Какой язык и драйвер?

  • Профиль удален
    6 июля 2018, 12:07 |

    Python

    Вродебы использовал Гугл.

    Как насчёт решения такого: попробовать создать типо сеть ботов?  Тоесть даже не 2х ПК открыть этот софт. Шанс упустить важное меньше

  • Анатолий Безмощук
    6 июля 2018, 12:12 |

    Почему не PhantomJS, я вот так и не смог заставить его работать на других языках, но вот для Node.js довольно прикольная фича. позволяет выполнять js под капотом не вызывая визуальное отображение браузера

  • Игорь Виценко Webmaxstudio
    6 июля 2018, 12:06 |

    Парсер должен работать без остановки 24\7 и передавать данные с минимальной задержкой

  • Анатолий Безмощук
    6 июля 2018, 12:10 |

    Вот у Python я замечал такую неприятную штуку, что он теряет скорость при долгом выполнении цикла. У меня был скрипт на мобильную игру который проходился рандомно по ссылкам (поддерживал онлайн) и выполнял еще некоторые действия, сбор войск допустим, если надо, так спустя минут 5 он очень сильно терял скорость, при перезапуске скрипта всё было нормально, но опять же ненадолго 

  • Профиль удален
    6 июля 2018, 12:15 |

    Отпишитесь мне в ЛС, если хотите обсудить это. Вроде помню что-то такое, нудно вспомнить как решил

  • Анатолий Безмощук
    6 июля 2018, 12:20 |

    Мои попытки гуглежки ни к чему не привели

  • Eduard Karpets
    7 июля 2018, 16:04 |

    зачем использовать еще какую то библиотеку, если использовать селениум?

  • Профиль удален
    6 июля 2018, 11:47 |

    Вам нужны только те, кто проживает на Украине?

  • Игорь Виценко Webmaxstudio
    6 июля 2018, 11:51 |

    В приоритете разработчики проживающие в Киеве 

  • Профиль заблокирован
    6 июля 2018, 14:26 |

    Если на python, смотрите в сторону scrapy + splash, второй выполняет js под капотом, работает с формами и селектами, работа через запросы...

  • Игорь Виценко Webmaxstudio
    6 июля 2018, 15:33 |

    Спасибо за совет!

Актуальные фриланс-проекты в категории Python

Создание Тик-ток фермы с генерацией дохода

27 000 UAH

в поиске человека, который может написать софт, для фермы тик ток, чтобы мы смогли генерировать трафик, получать доход. Ищем готовое решение с полным циклом.

PythonРазработка ботов ∙ 1 день 11 часов назад ∙ 15 ставок

AI Commenting Platform для TikTok и Instagram.

Цель проекта Разработать систему, которая позволяет управлять большим количеством аккаунтов TikTok и Instagram и автоматически публиковать релевантные комментарии под выбранными видео с использованием ИИ. Основной функционал1. Управление аккаунтами Необходимо реализовать…

AI и машинное обучениеPython ∙ 2 дня 18 часов назад ∙ 22 ставки

Построить модель классификации клиентов

1. Есть данные клиентов в Mongo/SQL (примерно 20 000 записей с сырыми данными). 2. Необходимо на их основе построить фичи и модель классификации клиентов на поведенческие группы. 3. Проект выполнить на Python.

AI и машинное обучениеPython ∙ 4 дня 12 часов назад ∙ 43 ставки

ИТ Автоматизация ведения VAT-отчетности

10 000 UAH

Необходимо разработать систему для автоматизации переноса данных о продажах из CRM в бухгалтерскую систему Wafeq. Система должна импортировать банковские и платежные отчеты, автоматически сверять платежи с инвойсами, формировать инвойсы для VAT-отчетности и минимизировать ручную…

AI и машинное обучениеPython ∙ 4 дня 18 часов назад ∙ 51 ставка

Инструмент сверки счетов с банком, картами и бухгалтером

Техническое задание: инструмент сверки счетов с банком, картами и бухгалтеромОбщая цель Нужен локальный инструмент (скрипт/небольшое приложение на Python), который запускается вручную раз в 1-2 месяца на моём компьютере и делает сверку между: Счетами, которые я выставил клиентам…

PythonДесктопные приложения ∙ 5 дней 6 часов назад ∙ 43 ставки

Заказчик
Игорь Виценко Webmaxstudio
Украина Киев  65  0  1
Проект опубликован
7 лет назад
221 просмотр
Метки