Udoskonalić parser w pythonie

Parsowanie danych, Python — podano nieprawidłowe kategorie?

Zlecenie jest tłumaczone automatycznie. Zaloguj się lub zarejestruj się, żeby zobaczyć oryginał

Parser napisany w Pythonie. Biblioteka, która realizuje zbieranie danych reability.
Dokumentacja: https://pypi.org/project/readability/
Programista nagrał tzw. wideo, w czym jest problem. Tz w archiwum. 1 Wideo za Reability i 2 wideo za bootstrap. Także jak przyjmę cię do projektu. Przekażę wszelkie twoje pytania programiście.
U niego wyszło tylko tak. Dla nowicjuszy to pewnie nie w ich zasięgu. Dlatego zwracam się do profesjonalistów.
Co do bootstrapa. On też próbował to zrealizować, ale bootstrap dał gorsze wyniki w porównaniu do reability. Było dużo powielonej treści tego samego. I brał dodatkowy brudny kod, niepotrzebny kod.

O samym kodzie: kod napisany w Pythonie. Zapytania do serwera są wykonywane przez aiohttp,

bo projekt jest asynchroniczny, czyli równolegle wysyłane są zapytania do serwera, a nie po kolei.

Budowa wykonana przez bibliotekę PyInstaller. Uruchamiam program .exe, i uruchamia się wiersz poleceń. A sam parser otwiera się w przeglądarce, lokalnie pod adresem 127: i tak dalej.

Aby ocenić kod i koszt pracy. I żebyś nie pisał liczby z sufitu. Rozumiem cię. Napiszesz warunkową. Dlatego wygodna opcja. Podłączyli się do mojego komputera. Zobaczyli kod. Zrozumieli, że możesz poprawić wyniki parsowania i rozwiązać zadanie, aby brał nie tylko tekst, ale także obrazy ze stron. Wtedy zaktualizujesz swoją ofertę pod projektem, przyjmę cię do projektu. Wprowadzę rezerwę funduszy. I tylko tak! Bo! Jeśli nie spojrzysz w kod, napiszesz jakąkolwiek ofertę. Co z tego wyjdzie? Stracony mój czas na marne i pieniądze? A ty negatywna opinia? Myślę, że nie potrzebujesz tego. Myślę, że to wyjaśniliśmy. Teraz taki wynik dla przykładu 10 stron. Z 10 stron bierze tylko tekst z 5 stron, a z pozostałych 5 stron bierze tekst + obrazy. Tekst bierze ze wszystkich 10 stron. Myślę, że logika jest zrozumiała. Co potrzebne, aby obrazy były wybierane tak samo jak tekst ze wszystkich stron.
Nie obchodzi mnie, jak to zrealizować przez reability czy przez bootstrap. Najważniejsze, aby parser brał dokładniejsze dane. Przez reability bierze z każdej strony tekst, ale obrazy nie z każdej. Dlatego zadanie polegało na udoskonaleniu go lub połączeniu go z drugą biblioteką, algorytmem, technologią. Która wybierałaby obrazy. A on tekst.
Albo w ogóle zrobić przez bootstrap. Ale tylko, aby brał i tekst + obrazy i ze wszystkich stron. Krótko mówiąc, aby działało na bootstrapie nie gorzej niż na reability.
Mogę zapewnić dostęp przez anydesk, mogę sam skompilować i zebrać w bild.exe. Ty tylko wejdziesz na mój komputer, oceniasz kod. I zobaczysz, czy możesz coś zrobić w moim kodzie. Na bs4. Jeśli myślisz, że to poprawi zbieranie danych i rozwiąże mój problem, wtedy bez pytań. Jeśli przetestujemy i zobaczymy, że twoja technologia jest lepsza. Od razu wybieram cię do projektu. Wprowadzam rezerwę funduszy, ty wprowadzasz zmiany w kodzie. Testujemy. Jeśli wyniki są lepsze. Przyjmuję projekt.

Oferty 1 Odrzucone 2 Dyskusje 2

Pavlo Y.

47 7

Zlecenia 48
Ocena -
Ranking 1 952

Budżet: 1000 UAH Termin: 1 dzień

Dzień dobry. Jestem gotów zobaczyć, jak działa parser, a po tym podać cenę.

Maksym Sokolskyi

24 0

Zlecenia 24
Ocena -
Ranking 3 828

Budżet: 16000 UAH Termin: 1 dzień

Dzień dobry,

Jestem gotów zająć się Państwa projektem parsera w Pythonie do zbierania danych za pomocą biblioteki Reability. Mam doświadczenie w tworzeniu kodu w Pythonie i używaniu aiohttp do asynchronicznych zapytań. Złożone uruchomienie programu przez PyInstaller również znajduje się w moim arsenale.

Aby ocenić kod i opracować strategię zbierania zarówno tekstu, jak i obrazków z witryn, zapraszam do połączenia się z moim komputerem przez anydesk. Przy dokładniejszym przeglądzie kodu i testowaniu możemy wprowadzić niezbędne zmiany i ulepszenia, aby osiągnąć pożądany rezultat.

Moja stawka godzinowa wynosi 16$. Czekam na Państwa odpowiedź w celu dalszej współpracy.

Z poważaniem,
Maksym

W liście nie są widoczne oferty ukryte przez zleceniodawcę lub freelancerów z profilem Plus, a także oferty, które naruszają regulamin

Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych

API Reddit

Programowanie stron internetowych 25 ofert 30 lipca

Nie podano
Parsowanie strony, obejście ochrony Akamai

Python 39 ofert 30 lipca

Nie podano
Парсинг маркетплейсу

Tworzenie chatbota 31 ofert 30 lipca

144 PLN
Automatyczny import cen z cenników dostawców w formacie Google Sheets CSV na HOSZOP

Programowanie stron internetowych 66 ofert 29 lipca

424 PLN
Znaleźć i dodać linki do zdjęć do 900 samolotów.

Obróbka danych 33 oferty 28 lipca

169 PLN

Aleksandr Kremenyuk
Winnica, Ukraina
Кременюк О.О

Zleceń 44
Ocena 5.0
Ranking 644

Pavlo Y.

Aktualnie brak ofert

Maksym Sokolskyi

Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych

API Reddit

Parsowanie strony, obejście ochrony Akamai

Парсинг маркетплейсу

Automatyczny import cen z cenników dostawców w formacie Google Sheets CSV na HOSZOP

Znaleźć i dodać linki do zdjęć do 900 samolotów.