Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!
1500 ₴

Парсинг даних з https://angel.co/jobs

проект завершен


Потрібно зібрати (спарсити) базу з ~6000 компаній, які мають відкриті вакансії на https://goo.gl/pWX9YD. Табличка (база з потрібними колонками), яка потрібна на виході: https://goo.gl/e5ax4T На жаль, ми не знаємо точно ступені захисті сайту під парсингу (для прикладу чи не буде блокування після N переглядів профілів, чи не буде інших лімітів), тому якщо в процесі доведеться використати проксі будемо готові доплатити. Очевидно, що зібрати таку кількість вручну нереально, тому ми очікуємо, шо це буде або з нуля написаний скрипт на будь-якій мові програмування (наприклад, Python+Selenium) чи ви будете використовувати спеціалізований софт типу Datacol/HumanEmulator/Etc і просто надасьте вже готовий файл у вигляді CSV.


Інструкція по збору даних:

  1. Авторизуєтеся на angel.co за допомогою Facebook або доступів (login/pass), які нададуться обраному фрілансеру.

  2. Перейти на сторінку https://goo.gl/pWX9YD і по черзі на кожну компанію (http://prntscr.com/kf9r91), щоб відкрився більш детальний опис (http://prntscr.com/kf9rna) та збираєте інформацію про компанію у табличку (посилання вище).

  3. Company Name - копіюєте назву компанії звідси http://prntscr.com/kf9xf6

  4. Company Website - Посилання на сайт компанії є тут http://prntscr.com/kf9xtw У базу вносити посилання без http:// чи https:// Приклад - lark.com Якщо немає посилання на сайт - ставите "n/a".

  5. Company Industry - відкриваєте у новій вкладці сторінку компанії і копіюєте звідси якщо наявно http://prntscr.com/kf8srr

  6. Company Size - копіюєте звідси http://prntscr.com/kf9za7 або із відкритої вкладки із сторінкою компанії http://prntscr.com/kf8z9y

  7. Company Linkedin - якщо в п.4 є сайт, то робимо перехід на головну сторінку сайта і якщо там наявне посилання в коді сторінки в форматі https://www.linkedin.com/*** (приклад внизу сайту - https://prnt.sc/it7hsk).

  8. Company Location - Копіюєте з профілю компанії https://goo.gl/5AnbRD 

  9. CPerson Name - копіюєте звідси http://prntscr.com/kfa3uy технічного керівника або засновника компанії (CTO, Head of Development, Head of Technology, Technical Director, Director of Product, CEO, Founder, Co-Founder). Якщо інформації тут немає то вносимо в кінцеву таблицю просто "n/a", якщо там декілька контактних персон, то беремо першу зі списку.

  10. CPerson Linkedin - Посилання на профіль обраного керівника в Linkedin. Див. тут - https://goo.gl/KtqZvt, якщо немає, то просто ставите "n/a"

  11. CPerson Position - Назва позиції цього керівника. Див. тут - https://goo.gl/KtqZvt , якщо немає, то просто ставите "n/a"

  12. Technology stack - копіюєте весь опис відкритих вакансій - http://prntscr.com/kfcip0 

  13.  Vacancy 1 - копіюте гіперпосилання із назвою вакансій - https://prnt.sc/kfcj57

  14.  Заповнюєте Vacancy 2, Vacancy 3 і т.д до Vacancy10. (якщо вони є, якщо немає, то просто ставите "n/a"). У багатьох компаній буде лише одна вакансія. Такого що не буде жодної вакансії бути не може, бо це розділ Jobs, як мінімум одна має бути.

Отзыв заказчика об исполнителе Сергее Шульге

Качество
Профессионализм
Стоимость
Контактность
Сроки

Все зроблено чітко, згідно очікувань.

Любомир Р. Любомир Реверчук | Сейф Сейф

Отзыв фрилансера о заказчике Любомире Реверчуке

Оплата
Постановка задачи
Четкость требований
Контактность

Четкость и ясность поставленных задач = успешное выполнение. Надеюсь на дальнейшее сотрудничество 😉

Сергей Ш. Сергей Шульга | Сейф Сейф



  1.  фрилансер больше не работает на сервисе
  2. 3 дняскрыта
    Евгений Кузнецов
     690   18   0

    Із завданням ознайомився. Питань немає

    Можу написати парсер, а потім спарсити і надати результату в сsv форматі і сам парсер
    За проксі доплачувати непотрібно
    Термін вказав з запасом. Зроблю швидше, якщо не буде блокувань

    Украина Ровно | 6 августа в 22:05 |
  3. 1 деньскрыта
    Ярослав Фрилансер
     387   22   0

    Пользуюсь хорошим парсером. Обращайтесь [email protected] или скайп jager-j

    Украина Кропивницкий (Кировоград) | 6 августа в 22:13 |
  4. ставка скрыта фрилансером
  5. 2 дняскрытаПобедившая ставка
    Сергей Шульга
     1014  проверен   19   0

    За описание задания вам ++ 😉
    Завтра к вечеру будет готово. Откройте только доступ к табличке для [email protected]

    https://docs.google.com/spreadsheets/d/1uuWJjXcUooiGV2CwSeJOr9fQxnp41tgCwopCRjLLpDE/edit#gid=0

    Украина Винница | 6 августа в 23:01 |
  6. 7 днейскрыта
    Виктория Пустоварова
     587   9   0

    Добрый день
    Большой опыт написания парсеров различной сложности
    Могу предоставить как файл, так и сделать программу для самостоятельного парсинга.

    Украина Днепр | 7 августа в 11:13 |

Заказчик
Любомир Реверчук
Украина Львов  48   0  1
Проект опубликован
6 августа в 21:06
132 просмотра
Приглашены на проект