Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Post your project for free and start receiving proposals from freelancers within minutes after publication!

Парсер на PHP

113 USD

  1. 72    3  1
    7 days338 USD

    Внимательно прочитал задание, есть пару вопросов, например:
    1. Почему не справились предыдущие фрилансеры?
    2. Есть какое то техническое ограничение на парсинг StackOverflow с их стороны?

    О себе:
    Senior Full Stack Dev в одной из топовых компаний Украины. Есть опыт менторинга, 1to1. Написал много интеграций с различными сервисами - от поставщика интернет услуг до интеграций с ERP системами. Опыт улучшения и имплементации бизнес процессов.

    Skills:
    4+ years of experience with Java 7, 8, 11;
    4+ years of experience with React.js,Node.js;
    Experience with common front-end development tools such as Babel, Webpack, NPM, etc.;
    Experience with Microservice architecture;
    Experience with third parties integration;
    Strong knowledge of Typescript;
    Strong knowledge of HTML5, CSS3 and ECMAScript 6+;
    Ability to cover production code with tests — both unit and integration ones;
    Willingness to learn and to work with Scala; English B2.

  2. 291    3  1
    25 days677 USD

    Добрый день.
    ОПЫТ РАБОТЫ БОЛЕЕ 8 ЛЕТ. Буду рад сотрудничеству.
    Пишите Л.С., обсудим.

  3. 647    42  0
    4 days113 USD

    Добрый день, можете более подробно рассказать. парсер будет висеть как демон и постоянно парсить или будет вводиться вопрос на вашем сайте и в этот момент будет переводится на англ и искать на стек овер флов и найденый ответ записывать в бд перевод?
    какой перевод? гугл траслейт (апи подойдет 20$\1млн стоимость у гугла)

  4. Another 4 proposals concealed
  • Profile blocked
    28 June 2021, 15:33 |

    Если несколько брались, видимо не читали тз ибо по первому пункту уже ясно что задача не для php. В php нет многопоточности. Есть конечно pthreads, но это нужно на сервер устанавливать это расширение. Отзывы о такой "многопоточности" сомнительные 

  • Profile deleted
    28 June 2021, 16:02 |

    Есть и другие расширения на эту тему, если POSIX вас чем-то обидел. Но вас никто не принуждает форкать конкретный функционал и расшаривать память. 

    Например, если вы можете запустить н-нное количество копий приложения и они будут работать обособленно с разными наборами данных, то чем вам это не многопоточность? 

  • Profile blocked
    28 June 2021, 16:04 |

    тогда нужно дополнительно реализовывать очередь, пул заданий, писать дополнительный велосипед 

  • Profile deleted
    28 June 2021, 16:10 |

    Т.е. писать приложение? Да.

    От того что вы возьмете другой язык, где многопоточность реализована нативно -  необходимость распараллеливать и собирать общую очередь на обработку никуда не денется. Или вы в одном потоке предлагаете 100500 страниц собрать и каждую сразу на асинхронную обработку отдавать?

  • Profile blocked
    28 June 2021, 16:15 |

    Мораль моего первого сообщения в том, что каждый язык имеет ряд плюсов и минусов, где один язык силен, а другой и вовсе не годится. В данном случае это работа не для php. Конечно все зависит от рук, но затраченного времени будет в разы больше.
    Нет, я не предлагаю это делать асинхронно, мало какой проект, где есть большое количество задач, обходится без брокеров сообщений

  • David Bur'yanuvaty
    28 June 2021, 15:51 |

    А зачем тут многопоточность. Речь не идет в задание о скорости. Пусть шуршит себе скрипт в одном потоке. Данные  будут парситься и всё будет хорошо))

  • Profile blocked
    28 June 2021, 15:52 |

    Техническое задание на разработку парсера вопросов и ответов со stackoverflow.com



    Нужно реализовать парсер всех вопросов (как с ответами, так и без них) с последующим переводом на русский язык через переводчик Google (готовая библиотека)


    Парсер должен быть многопоточным.

    Я об этом

     

  • Profile blocked
    28 June 2021, 15:52 |

    не увидела что ответ не мне, прошу прощения

  • Gavryushina Lyubov
    28 June 2021, 16:14 |

    Если на php не получится, то можно на другом языке. Парсер будет работать на сервере, пока не спарсит все вопросы.

  • Profile blocked
    28 June 2021, 16:18 |

    Спасибо за ответ.

  • Profile blocked
    28 June 2021, 16:19 |

    Но на вопросы отвечают каждый день. Нужен функционал который будет сверять вопросы и добавлять новые? или это разовая обработка? 

  • Gavryushina Lyubov
    28 June 2021, 16:27 |

    Сверять и добавлять

  • Profile deleted
    29 June 2021, 1:01 |

    21 417 018 вопросов)) Даже, если по 1 млн в день парсить, то тут 20 дней надо минимум))

Current freelance projects in the category Data Parsing

Python / Network Engineer: Network optimization of the bot (WAF, Connection Pooling, Asyncio)

Simplified version! Please respond only if you understand and are knowledgeable. About the project: An automated bot for sniping. The basic business logic (parsing, authorization, assembling JSON/XML packages) is already ready and works on Python. The target environment is Linux…

PythonData Parsing ∙ 11 hours 37 minutes back ∙ 14 proposals

OpenCart — rental catalog of special equipment

135 USD

OpenCart — Equipment Rental Catalog Need to launch an equipment rental catalog on OpenCart. Theme: excavators cherry pickers forklifts generators cranes scaffolding other construction equipment. It is preferable that you already have a ready-made template or developments…

Web ProgrammingData Parsing ∙ 11 hours 47 minutes back ∙ 42 proposals

Transfer the program - the server where the program was located has crashed (officially permitted parsing of government data)

47 USD

Hello! My client has encountered the case described below. We need help transferring to a new server and testing the program. It would be better to have a programmer who understands parsing.

Software & Server ConfigurationData Parsing ∙ 15 hours 40 minutes back ∙ 22 proposals

Parsing and classification of a large array of images

It is necessary to implement a project for collecting and structuring a large array of architectural images from open web sources.The task includes: automated collection of images; uploading files in the highest available quality; classification of images by categories:…

PythonData Parsing ∙ 16 hours 8 minutes back ∙ 30 proposals

Parsing Resumes from Work.ua and Rabota.ua

It is necessary to download a database of current resumes from Work.ua and Rabota.ua in Excel format. It is preferable that the Excel file contains the following columns: Name Phone number (in the format +380...) Email Position (profession) Positions considered Category of…

Information GatheringData Parsing ∙ 1 day 15 hours back ∙ 18 proposals

Client
Gavryushina Lyubov
Ukraine Lvov  69  0
Project published
4 years back
137 views