Скрапер/Парсер на Angel list
Рады будем пригласить разработчика для создания небольшого узкоспециализированного скрапера в google chrome в виде "extension" для сайта Angel.co. Extension будет мануально добавляться, поэтому guidelines для google web store соблюдать не стоит.
Путь к странице на которой будет производится скрапинг (https://angel.co/"название компании"/source):
1) Заходим на Angel.co и регистрируемся
2) Создаем cвою компанию (https://monosnap.com/file/QdFRn10W6HD8GwL7KMOlpiPMPL7Cym#)
3) Заходим в Recruit (https://monosnap.com/file/N7NEe2iYf1oQ5YdmfzBUJdaoVhyrvy#)
4) Далее переходим в Resource (https://monosnap.com/file/3A0RmyR40IhaN6hSMXelJG8DaY6WfO)
5) Попадаем на страницу где будем "скрапить" (https://monosnap.com/file/yo2A2W0ZwZuOv3F837NG54dxZ3KtIV#)
Создан тестовый аккаунт чтобы пропустить пункт 1-2.
Email: [email protected]
Password: freelancetest123
Описание функционала:
Часть I (Визуализированный вариант - https://monosnap.com/file/nxvzZKpMUPQCzmlmkKgB84cYw2LHpS#):
1. HTML страницы /source должен полностью быть заскраплен с учетом infinite scroll (чтобы весь список людей был доступен в HTML коде).
2. В коде должны идентифицироваться блоки div с инофрмацией пользователей (https://monosnap.com/file/SV4cM2rjgzWuVTvFUU5InbyBgfwytf#) в которых:
2.1 В случае отсутствия facebook_url внутри блока (https://monosnap.com/file/7AKy6Vdy23IxPx42rvc83Tk93NKrhF#), скрапер продолжает искать совпадения в следующем блоке. В случае наличия facebook_url - шаг 2.2.
2.2 Когда найдено совпадение с facebook_url в блоке скрапер должен идентифицировать совпадение с именем пользователя (прим. (https://monosnap.com/file/ulOQ3W5YuYo73OmTkKem4VwdoysMev#)) (которое было указано в GUI extension), если совпадение имеется, скрапер начинает доставать эти данные (шаг 3). В случае несовпадения имени в блоке с найденным facebook-url - блок пропускается.
3. Скрапер берет facebook_url и выводит в GUI или в текстовый файл (подходит любой удобный формат для копи паста) и переходит к следующему блоку до конца кода.
Часть II - https://monosnap.com/file/nxvzZKpMUPQCzmlmkKgB84cYw2LHpS# (цена обговаривается за вторую часть отдельно):
1. Добавить "www.angel.co" в каждый facebook_url (/link/673267/6b6c4610b85b3d79063645b3eb3b7e59/facebook_url) -> чтобы получилось -(www.angel.co/link/673267/6b6c4610b85b3d79063645b3eb3b7e59/facebook_url)
2. Каждая ссылка открывается по очереди в одной вкладке (ваш вариант?)
3. В случае присутствия app_scoped_user_id в ссылке, удалять из списка
4. Копируется конечный адрес и title facebook страницы в GUI или текстовый документ
Уточнения:
* Скрапинг будет проводиться с разными поисковыми фильтрами, но на той же странице c идентичной структурой. (/source) -> (/source?query="data"&refinementList[primary_role][0]=Software Engineer&refinementList[locations][0]=Silicon Valley)
* Интересует только качество, арт и удобность не первый приоритет.
Интересует только ФИКСИРОВАННАЯ цена.
-
Недавно закончил проект по парсингу Angel.co . Разобраться было бы интересно в вашем проекте, но интересует мин. бюджет 🙂
-
Current freelance projects in the category Data Parsing
Create a dashboard in https://airtable.com/ for the performance of advertising creatives from Facebook ads.Full specification https://docs.google.com/document/d/1_n_oYRNZWYxalUA---DM5AD1b5ZSrtePw5J4G42svGw/edit?usp=sharing Databases & SQL, Data Parsing ∙ 1 day 4 hours back ∙ 17 proposals |
Creation of an Excel file for uploading products to the websites of other partners.I am interested in creating an Excel table with all parameters. Here is the website - https://heiztechnik.com.ua/ And the positions I am interested in to be transferred: Manual boilers: 1) TIS UNI 15-95 kW (10) pcs 2)TIS HARD 150-500 kW (7) pcs Pellet boilers: 1)TIS PELLET… Data Parsing ∙ 1 day 8 hours back ∙ 34 proposals |
A developer is required for parsing the catalog and automating data import.Detailed technical specifications in the attached document Please indicate the estimated cost and timeline in your response Do you have experience working with parsing large catalogs What possible difficulties or limitations do you see in this task Databases & SQL, Data Parsing ∙ 1 day 11 hours back ∙ 39 proposals |
Find a product feed (Google Merchant XML) for a website on OpenCart
16 USD
It is necessary to find a direct link to the active product feed (XML) of a competitor for Google Merchant Center Platform (CMS): OpenCart / ocStore Find the original feedRequirements for the result: Working link to the XML file Python, Data Parsing ∙ 1 day 16 hours back ∙ 21 proposals |
Parsing products from supermarketsNeed a specialist (parsing + Google Sheets + automation). Goal: Create a system for automatic retrieval and updating of food prices from Silpo and NOVUS supermarkets with data output to Google Sheets. What needs to be implemented: Create a main Google Sheets table with a product… Data Parsing, Information Gathering ∙ 2 days back ∙ 46 proposals |