Скрапер/Парсер на Angel list
Рады будем пригласить разработчика для создания небольшого узкоспециализированного скрапера в google chrome в виде "extension" для сайта Angel.co. Extension будет мануально добавляться, поэтому guidelines для google web store соблюдать не стоит.
Путь к странице на которой будет производится скрапинг (https://angel.co/"название компании"/source):
1) Заходим на Angel.co и регистрируемся
2) Создаем cвою компанию (https://monosnap.com/file/QdFRn10W6HD8GwL7KMOlpiPMPL7Cym#)
3) Заходим в Recruit (https://monosnap.com/file/N7NEe2iYf1oQ5YdmfzBUJdaoVhyrvy#)
4) Далее переходим в Resource (https://monosnap.com/file/3A0RmyR40IhaN6hSMXelJG8DaY6WfO)
5) Попадаем на страницу где будем "скрапить" (https://monosnap.com/file/yo2A2W0ZwZuOv3F837NG54dxZ3KtIV#)
Создан тестовый аккаунт чтобы пропустить пункт 1-2.
Email: [email protected]
Password: freelancetest123
Описание функционала:
Часть I (Визуализированный вариант - https://monosnap.com/file/nxvzZKpMUPQCzmlmkKgB84cYw2LHpS#):
1. HTML страницы /source должен полностью быть заскраплен с учетом infinite scroll (чтобы весь список людей был доступен в HTML коде).
2. В коде должны идентифицироваться блоки div с инофрмацией пользователей (https://monosnap.com/file/SV4cM2rjgzWuVTvFUU5InbyBgfwytf#) в которых:
2.1 В случае отсутствия facebook_url внутри блока (https://monosnap.com/file/7AKy6Vdy23IxPx42rvc83Tk93NKrhF#), скрапер продолжает искать совпадения в следующем блоке. В случае наличия facebook_url - шаг 2.2.
2.2 Когда найдено совпадение с facebook_url в блоке скрапер должен идентифицировать совпадение с именем пользователя (прим. (https://monosnap.com/file/ulOQ3W5YuYo73OmTkKem4VwdoysMev#)) (которое было указано в GUI extension), если совпадение имеется, скрапер начинает доставать эти данные (шаг 3). В случае несовпадения имени в блоке с найденным facebook-url - блок пропускается.
3. Скрапер берет facebook_url и выводит в GUI или в текстовый файл (подходит любой удобный формат для копи паста) и переходит к следующему блоку до конца кода.
Часть II - https://monosnap.com/file/nxvzZKpMUPQCzmlmkKgB84cYw2LHpS# (цена обговаривается за вторую часть отдельно):
1. Добавить "www.angel.co" в каждый facebook_url (/link/673267/6b6c4610b85b3d79063645b3eb3b7e59/facebook_url) -> чтобы получилось -(www.angel.co/link/673267/6b6c4610b85b3d79063645b3eb3b7e59/facebook_url)
2. Каждая ссылка открывается по очереди в одной вкладке (ваш вариант?)
3. В случае присутствия app_scoped_user_id в ссылке, удалять из списка
4. Копируется конечный адрес и title facebook страницы в GUI или текстовый документ
Уточнения:
* Скрапинг будет проводиться с разными поисковыми фильтрами, но на той же странице c идентичной структурой. (/source) -> (/source?query="data"&refinementList[primary_role][0]=Software Engineer&refinementList[locations][0]=Silicon Valley)
* Интересует только качество, арт и удобность не первый приоритет.
Интересует только ФИКСИРОВАННАЯ цена.
-
Недавно закончил проект по парсингу Angel.co . Разобраться было бы интересно в вашем проекте, но интересует мин. бюджет 🙂
-
Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych
Znaleźć feed produktowy (Google Merchant XML) dla strony na OpenCart
58 PLN
Konieczne jest znalezienie bezpośredniego linku do działającego pliku z danymi produktowymi (XML) konkurenta dla Google Merchant Center Platforma (CMS): OpenCart / ocStore Znajdź oryginalny plik z danymiWymagania dotyczące wyniku: Roboczy link do pliku XML Python, Parsowanie danych ∙ 40 minut temu ∙ 10 ofert |
Należy rozebrać bazę danych tak, aby na wyjściu wyszły pliki w formacieJest baza danych forum i pliki forum XENFORO 1.6. Należy stworzyć plik importu do innego skryptu, ale wszystkie pola muszą być zachowane. Przekazuję pliki z wymaganiami oraz plik FAQ, które pola są mi potrzebne. Pliki z wymaganiami dotyczą każdego osobnego typu parametrów. To… Bazy danych i SQL, Parsowanie danych ∙ 6 godzin 33 minuty temu ∙ 6 ofert |
Parsowanie produktów z supermarketówPotrzebny specjalista (parsowanie + Google Sheets + automatyzacja). Cel: Stworzyć system automatycznego pozyskiwania i aktualizacji cen produktów spożywczych z supermarketów Silpo i NOVUS z wyjściem danych do Google Sheets. Co należy zrealizować: Stworzyć główną tabelę Google… Parsowanie danych, Wyszukiwanie i zbieranie informacji ∙ 8 godzin 30 minut temu ∙ 28 ofert |
Newsletter LinkedIn
438 PLN
Newsletter LinkedIn Należy uruchomić newsletter LinkedIn na podstawie podanej bazy. 30 000+ kontaktów Czekamy na propozycje E-mail marketing, Parsowanie danych ∙ 1 dzień 16 godzin temu ∙ 9 ofert |
Parsowanie emaili firm z określonej branży
411 PLN
Znajdź kontakty (e-mail, numer telefonu) firm, które zajmują się określonym biznesem, wskazanym w tym dokumencie Google https://docs.google.com/document/d/1_d-iLxLSL3gjRvo1GmUpWNm0Pm5YoKGcEvaiDc_2I0g/edit?usp=#sharing Wynik ma być w formie tabeli z kolumnami: 1. Telefon w… Parsowanie danych ∙ 2 dni 16 godzin temu ∙ 31 ofert |