Parzer dla witryny
Istnieje strona z dostępem log i hasła - http://costar.com/.
Istnieje 5 typów wyszukiwania, z których 4 typy z różną strukturą wyszukiwania.
Do parsingu tej strony jest gotowy skrypt na Piton, ale jego prędkość pracy jest mniejsza niż jest to konieczne.
Wymagane prędkość - nie więcej niż 5 sekund na parsing 1 nagrania. Teraz osiąga 8s, ze względu na pośrednie parsing z adresem URL, a metodą kliknięć i przejść.
Aby ułatwić zadania i skrypt - zdecydował się na autoryzację na stronie i przejście do wyszukiwarki zrobić ręcznie.
Automatyzuj tylko część z parsingiem danych i przechowywaniem w formacie CSV lub XLSX (przyłączam formularz pliku).
Aby uzyskać dostęp do witryny, potrzebny jest NordVPN lub indywidualny płatny proxy z lokalizacją w USA, Los Angeles.
Jako opcja, dostęp może być udostępniony z mojego komputera na odległość za pośrednictwem Anydesk lub Teamviewer.
Jest mile widziany każdy język programowania. Wystarczy uruchomić tylko z Windows.
Вот видео работы Питон парсера сейчас - https://youtu.be/SCVxXKs19ak, между запросами интервал 8 сек, нужно 2-5сек.
Załączniki 1
Opinia zleceniodawcy o współpracy z Nikolay Kravchenko
Parzer dla witrynyByło to opóźnienie z czasem, ponieważ strona okazała się znacznie trudniejsza niż wydaje się na pierwszy rzut oka. Została przeprowadzona ogromna praca nad testowaniem i badaniem wszystkich możliwych cech strony. Wykonawca cierpliwie i metodycznie poruszał się do zakończenia z dnia na dzień i osiągnął sukces! Pracowny i odpowiedzialny freelancer, którym można zaufać wykonywanie nawet bardzo trudnych zadań w swojej specjalizacji. Polecam współpracę!
-
Oferta, która wygrała3 dni164 PLN
499 45 4 Oferta, która wygrała3 dni164 PLNPozdrawiam . Gotowy do wykonania zadania w ciągu 3 dni, koszt 2000 UAH. Posiadamy duże doświadczenie w parsingu.
-
283 10 0 Pozdrawiam .
Mam ogromne doświadczenie w parsingu danych.
Realizuję to na Pythonie.
Wykonuję to szybko i jakościowo.
Obracaj się
-
1641 23 0 Pozdrawiam .
Jesteśmy gotowi wziąć udział w tym projekcie, ale na początek trzeba zapoznać się z źródłem.
Wykonujemy aplikację w języku Python.
Czekam na Was w osobistych wiadomościach
-
223 8 0 Pozdrawiam . Wygląda na to, że widziałem to działa na selenium. Istnieje doświadczenie z nim, również niedawno zrobił wielofunkcyjny parzer z jego zastosowaniem. Musisz zobaczyć, co się tam robi, myślę, że jest coś do optymalizacji.
Okres określony jest maksymalnie. W tym momencie łatwiej będzie pisać wszystko z nuli.
-
1520 41 2 Jesteśmy gotowi pomóc Ci w optymalizacji parsera. Najprawdopodobniej jest on napisany za pomocą Selenium, można przyspieszyć proces tłumaczenia na wielotykowość, ale można rozważyć inną opcję, która będzie znacznie szybsza, ale trzeba już spojrzeć na sam system autoryzacji na stronie, o tym szczegółowo w LS. Terminy wskazane dla opcji z optymalizacją.
-
875 51 0 1 Gotowy do współpracy.
Piszę na pietrze.
Od Ciebie - kod źródłowy, dane do autoryzacji i proxy do testowania.
Zwróć się.
-
75 9 2 3 Pozdrawiam ! Istnieje duże doświadczenie w parsingu (około 2 lat). Przygotuj się do wykonania jak najszybciej na c# wpf. Na rachunek autoryzacji, profil jeden cały czas się łączyć?
-
4796 67 0 Pozdrawiam . Gotowy do wykonania parsera. Doświadczenie w parsingu danych. Wpisz do Ls szczegółowe informacje
-

И у меня почему-то поиск типа https://www.costar.com/search?market=3&tags=256&page=2 прекрасно работает без авторизаций и локаций...
-

Посмотрела видео, но все еще не поняла.
Нормальный парсер по своей функциональности - это ЧАСТЬ механизма браузера, которая берет ТОЛЬКО НУЖНОЕ и складирует его в какую-то БАЗУ - т.е. ничего человеческого в его действиях быть не может! Для чего парсер и помещают обычно на сервере, где нет человека, одни программы, инфа и все быстрое.
Да, в тяжелых случаях (яваскрипты) нужно извращаться и иногда даже нет выхода, кроме как задействовать весь браузер. Но и тогда обычно его (браузер) тянут на сервер (предварительно обрезав в нем все человеческое).
Почему же здесь парсер, как я понимаю, на клиенте стоит? И почему считается, что руками человека получится быстрее листать страницы?
-

Короче, я предлагаю поставить такой вопрос. На том сайте выдача публичного поиска типа https://www.costar.com/search?market=3&tags=256&page=2 кардинально отличается от выдачи нужного поиска или нет???
Если кардинальных отличий нет, то (почти) любой (программист) может посмотреть как работает публичный поиск, какие даются запросы, какие приходят ответы. И прикинуть парсер для этого.
-
Aktualne zlecenia dla freelancerów w kategorii Javascript & Typescript
Full-stack rozwój — Amazon PPC Dashboard (Etap 1)Potrzebny programista full-stack z doświadczeniem w pracy z Amazon API do realizacji Etapu 1 wewnętrznego dashboardu PPC. Projekt realny, dane żywe, wszystko gotowe do startu. Prototyp frontendu (5 stron, React + TypeScript): CO JUŻ GOTOWE — Prototyp frontendu na React 18 +… Javascript & Typescript, Programowanie stron internetowych ∙ 1 dzień 15 godzin temu ∙ 27 ofert |
Opracowanie strony internetowej do tworzenia fotoksiążek i ram fotowychCel projektuNależy opracować nowoczesną stronę internetową do zamawiania fotoksiążek, ram fotowych i innych spersonalizowanych produktów fotograficznych.Głównym celem projektu jest umożliwienie klientowi samodzielnego stworzenia gotowego projektu produktu bez udziału projektanta… Javascript & Typescript, Programowanie stron internetowych ∙ 3 dni 7 godzin temu ∙ 96 ofert |
Zespół do samodzielnie stworzonej platformy rynkowej usług pogrzebowych.Poszukujemy zespołu do uruchomienia i rozwoju autorskiej krajowej platformy rynkowej usług pogrzebowych. Od razu: nie szukamy pojedynczych osób, juniorów ani "zbieraczy stron". Potrzebny jest silny zespół produktowy na poziomie middle+/senior z rzeczywistymi przypadkami… Javascript & Typescript, Programowanie stron internetowych ∙ 4 dni 2 godziny temu ∙ 27 ofert |
Dopracowanie istniejącego projektu Next.js/Supabase: oferty, CRM, analityka, czat AIIstnieje działający projekt WatchGenius — platforma analityczna luksusowych zegarków z katalogiem modeli, analizą cen, zewnętrznymi ofertami, formularzami zgłoszeniowymi i czatem AI. Projekt został już częściowo opracowany. Potrzebny jest doświadczony programista full-stack,… Javascript & Typescript, Programowanie stron internetowych ∙ 6 dni 3 godziny temu ∙ 55 ofert |
Szukam Senior Full-Stack dewelopera (Payload CMS) — migracja 2 stron internetowych sieci hoteliSieć kurortowych hoteli przechodzi z Webflow na własny headless-stack. Dwie strony korporacyjne (~140 stron razem), architektura multi-tenant — jeden kod obsługuje kilka hoteli na różnych domenach. Projekt już wystartował: infrastruktura jest wdrożona, najemcy są… Content Management Systems, Javascript & Typescript ∙ 10 dni 1 godzina temu ∙ 19 ofert |