Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!

Разработать парсер (python)


  1. 190    1  0   1
    1 день100 UAH

    Добрый день.
    Давайте пообщаемся и всё обсудим.
    Опыт, работы в личку

  2. Еще 3 ставки скрыты
    1 ставка скрыта
  • Анатолий Безмощук
    6 июля 2018, 11:42 |

    К сожалению beautifulsoup не умеет парсить динамические сайты (контент подгружается через javascript) так как не умеет выполнять эти сценарии.

  • Игорь Виценко Webmaxstudio
    6 июля 2018, 11:44 |

    Спасибо за комментарий! Нам это известно, с динамическими данными справиться selenium

  • Анатолий Безмощук
    6 июля 2018, 11:47 |

    Такое себе, медленный довольно, даже на C#, не говоря уже про Python

  • Игорь Виценко Webmaxstudio
    6 июля 2018, 11:49 |

    Какие решения на Ваш взгляд лучше?

  • Анатолий Безмощук
    6 июля 2018, 11:51 |

    Честно говоря на пайтон я не смог найти достойного решения для динамечиских сайтов. Вот BeautifulSoup4 + requests это просто крутое сочитание для статики. А с динамикой я не находил достойных модулей

  • Профиль удален
    6 июля 2018, 11:53 |

    А зачем ему скорость? Не думаю что там что-то будет появляться каждую долю секунды

  • Игорь Виценко Webmaxstudio
    6 июля 2018, 11:55 |

    Коэффициенты могут меняться каждую секунду

  • Профиль удален
    6 июля 2018, 11:56 |

    Ну а с интернетом тут вас как? Скорость позволит быстро загружать страницы?

  • Игорь Виценко Webmaxstudio
    6 июля 2018, 12:06 |

    Да, это не проблема
    По сути страницу нужно загрузить 1 раз и постоянно по ней проходиться и передавать данные (для некоторых сайтов страниц может быть несколько)
    Парсер должен работать без остановки 24\7 и передавать данные с минимальной задержкой

  • Анатолий Безмощук
    6 июля 2018, 11:58 |

    ну да для вытягивания одной несчастной ссылки с одной странички скоросто особо не нужна. Задачи бывают разные. Я к примеру пытался поймать определенный товар на торговой площадке который было нереально поймать вручную и для таких задач он медленный довольно + браузер открыт это забирает как скорость на загрузку лишних картинок, так и оперативу. Или если сайтов к примеру 1000 и нужно пропарсить много страниц и вытащить много данных. Сколько такая прога работать будет? 2 дня? 5? Скорость важна всегда

  • Профиль удален
    6 июля 2018, 12:02 |

    Я 40к страниц парсил Сплинтером(это доработка селениум, или как это назвать)

    Заняло день

  • Анатолий Безмощук
    6 июля 2018, 12:04 |

    Какой язык и драйвер?

  • Профиль удален
    6 июля 2018, 12:07 |

    Python

    Вродебы использовал Гугл.

    Как насчёт решения такого: попробовать создать типо сеть ботов?  Тоесть даже не 2х ПК открыть этот софт. Шанс упустить важное меньше

  • Анатолий Безмощук
    6 июля 2018, 12:12 |

    Почему не PhantomJS, я вот так и не смог заставить его работать на других языках, но вот для Node.js довольно прикольная фича. позволяет выполнять js под капотом не вызывая визуальное отображение браузера

  • Игорь Виценко Webmaxstudio
    6 июля 2018, 12:06 |

    Парсер должен работать без остановки 24\7 и передавать данные с минимальной задержкой

  • Анатолий Безмощук
    6 июля 2018, 12:10 |

    Вот у Python я замечал такую неприятную штуку, что он теряет скорость при долгом выполнении цикла. У меня был скрипт на мобильную игру который проходился рандомно по ссылкам (поддерживал онлайн) и выполнял еще некоторые действия, сбор войск допустим, если надо, так спустя минут 5 он очень сильно терял скорость, при перезапуске скрипта всё было нормально, но опять же ненадолго 

  • Профиль удален
    6 июля 2018, 12:15 |

    Отпишитесь мне в ЛС, если хотите обсудить это. Вроде помню что-то такое, нудно вспомнить как решил

  • Анатолий Безмощук
    6 июля 2018, 12:20 |

    Мои попытки гуглежки ни к чему не привели

  • Eduard Karpets
    7 июля 2018, 16:04 |

    зачем использовать еще какую то библиотеку, если использовать селениум?

  • Профиль удален
    6 июля 2018, 11:47 |

    Вам нужны только те, кто проживает на Украине?

  • Игорь Виценко Webmaxstudio
    6 июля 2018, 11:51 |

    В приоритете разработчики проживающие в Киеве 

  • Профиль заблокирован
    6 июля 2018, 14:26 |

    Если на python, смотрите в сторону scrapy + splash, второй выполняет js под капотом, работает с формами и селектами, работа через запросы...

  • Игорь Виценко Webmaxstudio
    6 июля 2018, 15:33 |

    Спасибо за совет!

Актуальные фриланс-проекты в категории Python

Автоматизация процессоів через API и Phyton

Ниже описал текущий процесс и то, к какому результату хотелось бы прийти. Также прикладіваю файлы реалтного процесса чтобы лучше понять как он выглядит в ревльности Текущий процесс Сейчас весь процесс выполняется вручную: загрузка/выгрузка файлов, перенос данных между…

AI и машинное обучениеPython ∙ 30 минут назад ∙ 11 ставок

Необходимо создать бота в ТГ для оплаты подписки.

2000 UAH

Необходимо создать бота в телеграме, где пользователь сможет оформить подписку на доступ к веб-камерам, которые находятся во дворе. Организовать в боте оплату двух видов подписок (на месяц и на один день). Бот должен автоматически проверять оплату и после выдавать ссылку-доступа.

PythonРазработка ботов ∙ 13 часов 16 минут назад ∙ 65 ставок

Парсинг и классификация большого массива изображений

Необходимо реализовать проект по сбору и структурированию большого массива архитектурных изображений из открытых веб-источников.Задача включает: автоматизированный сбор изображений; загрузка файлов в максимально доступном качестве; классификацию изображений по категориям:…

PythonПарсинг данных ∙ 20 часов 16 минут назад ∙ 30 ставок

Бизнес-логикa платформы: подтверждение занятий, контроль посещаемости-и история уроков (Django

Доработка бизнес-логики образовательной платформы: подтверждение занятий, контроль посещаемости и история уроков (Django + React) Необходимо реализовать полноценную систему подтверждения уроков, контроля посещаемости и хранения истории подтверждений. Важно Перед началом…

Python ∙ 3 дня 1 час назад ∙ 29 ставок

Доработка административной панели образовательной платформы (Django + React)

Доработка административной панели образовательной платформы (Django + React) Описание проекта: Есть действующая образовательная платформа (marketplace, аналог Preply), разработанная на Django + React. Требуется доработать существующую административную панель и реализовать…

PythonВеб-программирование ∙ 4 дня 22 часа назад ∙ 58 ставок

Заказчик
Игорь Виценко Webmaxstudio
Украина Киев  65  0  1
Проект опубликован
7 лет назад
221 просмотр
Метки