LinkedIn Skrobacz danych
Cel projektu: Celem badawczym jest zrozumienie obecności w Internecie, mające na celu opracowanie Scraper tożsamości, który może analizować i kompilować informacje dostępne o osobie z publicznie dostępnych źródeł. To przedsięwzięcie badawcze zostanie podzielone na kilka faz, z których każda ma na celu uzyskanie konkretnych rezultatów, które można przedstawić zarządowi, aby wykazać postęp i praktyczność. Parametry wejściowe mogą obejmować imię osoby, zdjęcie lub numer telefonu, podczas gdy oczekiwany wynik będzie składał się z jednego lub więcej profili wraz z wynikiem prawdopodobieństwa wskazującym ich autentyczność.
Fazy projektu i rezultaty
Faza 1: Projekt pilotażowy - Scraping danych z LinkedIn
Cel: Przeprowadzenie projektu pilotażowego skupiającego się na scrapowaniu danych z LinkedIn w celu zidentyfikowania osób na podstawie podanych imion. W tej fazie znajduje się również skalowalna baza danych do przechowywania zebranych danych. W fazie 1 baza danych będzie przechowywać wyniki wyszukiwania oraz podstawowe informacje takie jak identyfikator, źródło danych, itp.
Wymagania dotyczące danych wejściowych: Podstawowe imię (np. Jan Kowalski).
Oczekiwany wynik: Profile odpowiadające osobom posiadającym podane imię, zawierające:
- Imię
- Nazwisko
- Lokalizację
- Zawód
- Zdjęcie profilowe
Rezultaty dla Fazy 1:
- Raport z kolekcji danych:
- Szczegółowy raport dotyczący procesu scrapowania danych, w tym użyte metody i narzędzia.
- Wyjaśnienie źródeł danych i legalności scrapowania danych z LinkedIn.
- Kompilacja profili:
- Baza danych ze zstrukturyzowanymi profilami odpowiadającymi podanym imionom
- Każdy profil zawierać określone szczegóły zgodnie z oczekiwanym wynikiem
- Algorytm wyniku prawdopodobieństwa:
- Opracowanie algorytmu do przypisywania wyniku prawdopodobieństwa wskazującego autentyczność profili.
- Dokumentacja wyjaśniająca kryteria i logikę działania systemu oceniania prawdopodobieństwa.
- Prezentacja dla Zarządu:
- Kompleksowa prezentacja podsumowująca wyniki i demonstrująca praktyczność Scraper tożsamości.
- Wizualizacje i wykresy prezentujące skuteczność i dokładność narzędzia w identyfikowaniu profili.
Jeśli Faza 1 zakończy się sukcesem i zostanie zatwierdzona, kolejne fazy zostaną zlecone deweloperom na podstawie sukcesu wykazanego w Fazie 1.
Kolejne Fazy:
Faza 2: API, scrapowanie wyszukiwarek internetowych, rozszerzenie na inne platformy mediów społecznościowych (np. Facebook, Twitter, Instagram) oraz bazy danych publicznych z uwzględnieniem dodatkowych parametrów wejściowych (np. obecny pracodawca, numer telefonu, itp).
Faza 3: Wdrożenie interfejsu graficznego użytkownika i włączenie tabel wyszukiwania, optymalizacji wyszukiwania, zaawansowanych funkcji analitycznych i raportowania
Faza 4: Udoskonalenia algorytmu oceny prawdopodobieństwa na podstawie opinii i wyników.
Wymagania dla Freelancerów:
Udokumentowane doświadczenie w scrapowaniu stron internetowych i analizie danych.
Biegłość w językach programowania takich jak Python, Java lub odpowiednie alternatywy.
Biegłość w RPA i narzędziach automatyzacji takich jak UiPath, BluePrism, Pega, AA lub odpowiednie alternatywy.
Znajomość platform społecznościowych i API.
Umiejętność dostarczania szczegółowych raportów i prezentacji.
Jak aplikować:
– Przedstaw krótkie wprowadzenie o sobie i swoim doświadczeniu w podobnych projektach.
– Dołącz przykłady poprzednich projektów związanych ze scrapowaniem stron internetowych i analizą danych.
– Opisz swoje proponowane podejście do Fazy 1 projektu.
– Odpowiedz z informacją o swojej dostępności oraz oczekiwanym harmonogramie i budżecie.
-
30 dni3635 PLN
956 14 0 30 dni3635 PLNDoświadczenie w scrapowaniu i tworzeniu systemów analitycznych jest znaczące. Projekty znajdują się w portfolio i historii zamówień. Scrapowanie danych nie stanowi problemu. Prawdopodobną ocenę autentyczności należy przeprowadzać z wykorzystaniem sztucznej inteligencji. Rekomendowanym przeze mnie modelem na dzień dzisiejszy jest ChatGPT4o. Przybliżona cena jednej oceny przy użyciu AI wyniesie około 1-3 centów. Graficzne przedstawienie, prezentacje dla zarządu powinien wykonywać inny specjalista. Scrapowanie danych, praca z bazą danych, analiza znajdują się w zupełnie innej dziedzinie zawodowej niż tworzenie prezentacji i wizualizacji. Cały projekt jako całość również nie powinien być realizowany siłami jednej osoby, niezależnie od jej poziomu profesjonalizmu, ze względu na obecność w projekcie zadań związanych z zupełnie różnymi dziedzinami wiedzy. Pierwsza faza projektu również powinna być podzielona na kilka części. Cena i termin są obecnie warunkowe, ponieważ projekt wymaga dalszego opracowania.
Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych
Potrzebny parser sklepu internetowego https://www.lcsc.com/należy regularnie (1 raz w miesiącu, lub przy uruchomieniu skryptu) uzyskiwać aktualne informacje o produktach dostępnych w sklepie https://www.lcsc.com/ z katalogu wszystkich działów… Parsowanie danych ∙ 4 godziny 2 minuty temu ∙ 26 ofert |
OpenCart — katalog wynajmu sprzętu specjalistycznego
492 PLN
OpenCart — katalog wynajmu sprzętu specjalistycznegoPotrzebne jest uruchomienie katalogu wynajmu sprzętu specjalistycznego na OpenCart.Tematyka:koparkipodnośnikiładowarkigeneratorydźwigirusztowaniainny sprzęt budowlany.Preferowane, abyście mieli już gotowy szablon lub… Programowanie stron internetowych, Parsowanie danych ∙ 20 godzin 28 minut temu ∙ 46 ofert |
Przenieść program - serwer, na którym był program, padł (oficjalne dozwolone parsowanie danych publicznych)
169 PLN
Witaj! Mój klient ma przypadek opisany poniżej. Potrzebna pomoc w przeniesieniu na nowy serwer i przetestowaniu programu. Lepiej, aby to był programista, który zna się na parsowaniu. Konfigurowanie oprogramowania i serwerów, Parsowanie danych ∙ 1 dzień temu ∙ 26 ofert |
Parsowanie i klasyfikacja dużej liczby obrazówNależy zrealizować projekt zbierania i strukturyzacji dużej ilości architektonicznych obrazów z otwartych źródeł internetowych.Zadanie obejmuje: automatyczne zbieranie obrazów; ładowanie plików w maksymalnie dostępnej jakości; klasyfikację obrazów według kategorii: Exterior;… Python, Parsowanie danych ∙ 1 dzień temu ∙ 30 ofert |
Parsowanie stronyWymagana jest implementacja 4 parserów (strony katalogowe) Jest specyfikacja, jest przykład kodu jako referencja. Do zadań należy: Napisanie parsera Podłączenie proxy Logika deduplikacji (przeniesienie logiki z przykładu) Logika haszowania według 3 pól Parser powinien… Parsowanie danych ∙ 2 dni 16 godzin temu ∙ 42 oferty |