Parsowanie strony YouControl (Jukontrol)
Trzeba wyciągnąć firmy z niektórych kategorii na stronie юконтрол, w tym 1) nazwa 2) ЄДРПОУ 3) kierownik 4) telefon
Wszystkie te dane są publiczne.
-
Cześć, pracowałem nad parsowaniem danych korporacyjnych z OpenCorporates dla platformy analitycznej - zebrałem ponad 50 000 rekordów firm z pełnymi informacjami o zarządzie i kontaktach w ciągu 3 dni.
Czy trzeba będzie również zbierać dodatkowe wskaźniki finansowe firm, które są dostępne w profilach YouControl, czy tylko podstawowe dane z listy?
Proponuję się skontaktować, chętnie doradzę Ci bezpłatnie z technicznej strony i opracujemy plan rozwoju + opowiem o moim zespole!
-
223 2 0 Dzień dobry. Mam dużo doświadczenia w parsowaniu. Zrobię w 1 dzień w pełni wspierany parser. + jeśli coś się zmieni w przyszłości, pomogę wszystko skonfigurować, aby znowu wszystko działało.
-
3010 274 7 3 Witam. Z danymi Юконтрол pracuję od ponad 4 lat. Dobrze znam się z ich specyfiką. Proponuję współpracę w Państwa projekcie.
-
656 9 0 Dzień dobry, Oleksand!\nOgólnie zadanie jest zrozumiałe, aby uzyskać dokładną odpowiedź na temat terminów i ceny, chciałbym wyjaśnić kilka kwestii, które pojawiły się po analizie twojego zadania.\nPisz w wiadomościach prywatnych – omówimy szczegóły i twoje życzenia.
-
1602 31 1 Dzień dobry, programowaniem w sieci zajmuję się od ponad 9 lat. Pracuję z REST API, frameworkami i CMS-ami takimi jak Django, Laravel, Yii2, WP, OpenCart, CodeIgniter itd. Jestem gotów wykonać zadanie. Opinie:
Freelancehunt
-
4797 162 1 1 Dzień dobry! Mogę to zrobić od razu. Będę zadowolony ze współpracy — proszę się zgłaszać!
-
650 2 0 Dzień dobry!
Parsowanie otwartych danych firm — to nasza specjalizacja, zadanie jest jasne. Zbieramy według potrzebnych kategorii: nazwa, NIP, kierownik, telefon → w Google Sheets / Excel.
Pracujemy przez proxy i z opóźnieniami, aby obejść limity YouControl bez blokad.
Jeden moment sprawdzimy na początku: część danych (szczególnie telefony) na YouControl czasami otwiera się tylko po rejestracji. Najpierw sprawdzimy, co jest dostępne bez autoryzacji — a jeśli telefony są za logowaniem, zaproponujemy rozwiązanie (zbierzemy to, co jest otwarte, lub podłączymy konto). To znaczy, gwarantujemy pełne zebranie właśnie otwartych pól.
Aby podać dokładną cenę i termin, ustalimy tylko zakres — ile firm / jakie kategorie. Podpowiesz listę kategorii, a od razu się zorientuję.
…
Szczegóły dotyczące projektu i konsultacja — w wiadomościach prywatnych. Jesteśmy gotowi do startu.
-
807 22 0 Dzień dobry!
Zainteresował mnie Państwa projekt. Mam doświadczenie w zbieraniu i strukturyzowaniu dużych zbiorów danych z otwartych źródeł, w tym rejestrów państwowych, katalogów biznesowych oraz platform analitycznych.
Będę w stanie zebrać firmy z potrzebnych kategorii na YouControl i przygotować tabelę z takimi polami:
• Nazwa firmy;
• Kod EDRPOU;
• Kierownik;
• Telefon.
…
W razie potrzeby mogę dodatkowo dodać obszar, miasto, status firmy, KOD lub inne otwarte dane.
Wynik dostarczę w formacie Excel lub Google Sheets z weryfikacją duplikatów oraz wygodnym strukturyzowaniem do dalszej pracy.
Jestem gotowa omówić listę kategorii, orientacyjną liczbę firm oraz terminy realizacji. Po doprecyzowaniu zakresu od razu będę mogła ocenić koszt prac i przystąpić do realizacji.
Będę się cieszyć na współpracę!
-
374 Cześć! Zadanie jest całkowicie zrozumiałe, jestem gotów zrealizować dla Ciebie stabilny i szybki parser do zbierania firm z YouControl pod klucz. Ponieważ strona ma silną ochronę przed automatycznym zbieraniem danych, napiszę skrypt w Pythonie z użyciem biblioteki Playwright (lub Selenium) i zintegrować ochronę przed blokadami (rotacja proxy, symulacja zachowania człowieka, praca z opóźnieniami), aby obejść CAPTCHA i Cloudflare. Skrypt będzie krok po kroku przechodził przez wybrane przez Ciebie kategorie i zbierał wszystkie 4 obowiązkowe punkty: nazwę, kod EDRPOU, imię i nazwisko kierownika oraz numery telefonów. Na wyjściu otrzymasz czystą, uporządkowaną bazę danych w wygodnym formacie (Excel / CSV). Napisz w prywatnej wiadomości, które kategorie należy zebrać jako pierwsze, a omówimy wszystkie szczegóły!
-
452 Dzień dobry!\nJestem gotów napisać parser w Pythonie do zbierania danych z YouControl (nazwa, EDRPOU, kierownik, telefon) według wskazanych kategorii.\nPracowałem z parsowaniem stron internetowych z ochroną przed botami (Selenium/Playwright). Wezmę pod uwagę możliwe ograniczenia YouControl (rate-limit, captcha) i zaproponuję działające podejście.\nTermin: 2-3 dni\nKoszt: 1200 UAH
-
296 Cześć! Mam doświadczenie w parsowaniu stron internetowych w Pythonie i jestem gotów wykonać Twoje zlecenie. Mogę opracować parser, dostarczyć kod źródłowy oraz instrukcję obsługi. Dane uzyskane po parsowaniu mogę dostarczyć w formacie CSV, XLSX lub w innym. Jestem gotów wykonać zlecenie w ciągu 2-3 dni za 1200 hrywien.
-
693 4 0 Dzień dobry. Jestem gotów wykonać zadanie. Mam dobre doświadczenie w dużym parsowaniu. Termin podaję z zapasem czasu.
-
5791 153 4 3 Dzień dobry! Jestem gotów wykonać tę pracę dla Ciebie. Napisz szczegóły.
-
4233 40 0 Dzień dobry
zadanie zrozumiałem, mogę je wziąć do pracy
sprawdzę to, co powiesz
teraz nie jestem zajęty, więc mogę szybko przystąpić do realizacji
-
395 38 0 Mogę to zrobić, a nawet na elementarnym Pythonie. Cena i kwota są podane.
-
2025 4 0 Cześć!
Mam duże doświadczenie w opracowywaniu rozwiązań do parsowania i przetwarzania danych (różne źródła, ochrona przed blokadami, automatyzacja). Jestem gotów wykonać postawione zadanie w najkrótszym czasie.
Proponuję omówić szczegóły w wiadomościach prywatnych.
-
620 1 0 Cześć! Zadanie jest jasne — zebrać z YouControl w potrzebnych kategoriach: nazwa, EDRPOU, kierownik i telefon.
Od razu o pułapce, żeby nie obiecywać pustych słów: YouControl ma ochronę przed botami, a telefon i imię oraz nazwisko kierownika często są ładowane osobnym zapytaniem, a nie znajdują się bezpośrednio w html karty. Zwykłymi requests nie da się wszystkiego zebrać — pójdę przez Playwright + sesję stealth, gdzie potrzebny jest headless przeglądarka. Mam gotowy parser self-healing: sam naprawia selektory, gdy strona zmienia układ, więc zbieranie nie łamie się w połowie drogi.
Wynik oddam w Excel / CSV / Google Sheets: nazwa, EDRPOU, kierownik, telefon + link do karty firmy do weryfikacji.
Aby dokładnie policzyć, dwa pytania:
1. Jakie dokładnie kategorie i ile mniej więcej firm — setki czy dziesiątki tysięcy? (od tego zależy, czy potrzebny jest proxy pool i przerwy przeciwko banowi)
2. Telefon bierzemy tylko ten, który jest otwarty na karcie, czy wszystkie dostępne kontakty?
…
Orientacyjnie: 1500 UAH / 2 dni dla setek-tysięcy wpisów. Jeśli dziesiątki tysięcy + mocna ochrona antybotowa — 2500–3000 UAH (proxy, przerwy). Dokładną cenę podam po odpowiedziach. Gotowy do startu.
-
1251 35 1 3 Witam, zrobię to szybko. W jakim formacie chcesz zapisać zebrane informacje?
-
232 Dzień dobry! Zrobię parser pod YouControl. Od razu o głównym problemie: jest tam ochrona przed botami, a telefon i kierownik często są ładowani osobnym zapytaniem, a nie leżą bezpośrednio w html karty — więc prostymi requests nie wszystko się zbierze, pójdę przez sesję z obejściem ochrony i, gdzie trzeba, headless przeglądarka. Wynik oddam w Excelu lub Google Sheets: nazwa, EDRPOU, kierownik, telefon, plus link do karty firmy do weryfikacji.
Aby dokładnie policzyć: 1) jakie dokładnie kategorie i ile mniej więcej firm się spodziewa — dziesiątki tysięcy czy kilka setek (od tego zależy, czy potrzebne są przerwy i proxy, aby nie złapać bana)? 2) telefon bierzemy tylko ten, który jest otwarty na karcie, czy potrzebne są wszystkie kontakty, które są dostępne?
Zrobię to w ciągu kilku dni. Cenę trzymam niższą od rynku — dopiero zaczynam tutaj i jestem zainteresowany, aby zrobić to szybko i czysto.
-
4975 41 4 1 Dzień dobry!\n\nJestem gotowy do realizacji parsowania YouControl w celu zbierania nazw, ЄДРПОУ, kierowników i telefonów firm. Mam doświadczenie w web scrapingu w Pythonie, pracy z proxy oraz w strukturalnym zbieraniu danych.\n\nNapisz do mnie w wiadomości prywatnej, ustalimy szczegóły.
-
2211 18 3 Dobry wieczór. Zajmuję się automatyzacją i parsowaniem w Pythonie. Mam doświadczenie w wyciąganiu informacji z YouControl. Chciałbym usłyszeć więcej szczegółów dotyczących zakresu pracy. Piszcie, omówimy wszystko i od razu przystąpię do wykonania.
-
727 6 0 jednorazowo czy na stałe?
________________________________________
-
2663 41 2 1 Dzień dobry. Jestem gotów to wykonać, od razu. Proszę tylko wyjaśnić, według jakich kryteriów mam parsować?
-
1543 15 0 Witam, nazywam się Mykyta.\nJestem gotów napisać parser dla YouControl, aby zebrać nazwy firm, ЄДРПОУ, imię i nazwisko kierownika oraz telefony z potrzebnych kategorii.\n\nJuż robiłem podobne parsery do zbierania otwartych danych z ukraińskich katalogów, wynik oddam w wygodnym formacie typu Excel.\nPortfolio:
Freelancehunt\n\nOrientacyjne cena, terminy: 1500 UAH, 1-2 dni.\nPiszcie, dogadamy się.
-
3392 84 0 Gotowy, aby się tym zająć. Należy wyjaśnić szczegóły zamówienia, piszcie! Używam Pythona, uv, github, docker.
-
2426 20 0 Dzień dobry, jestem gotów szybko i jakościowo wykonać twoje zadanie. Mam duże doświadczenie w tworzeniu różnych parserów. Napisz w wiadomościach prywatnych, omówimy szczegóły. Chętnie pomogę)