Parsowanie tekstowego PDF z tabelami
Musisz sparsować tekstowy PDF z tabelami i stworzyć dynamiczny obiekt ze wszystkimi danymi, które są w dokumencie.
Znajdują się w nim 2 główne tabele, które można "połączyć" w jedną, a następnie dla każdego wpisu z tej tabeli - według tabeli szczegółowych informacji nieco niżej po głównych tabelach.
Byłoby dobrze, żebym mógł później pracować z tymi danymi za pomocą Pythona
Z góry dziękuję
Załączniki 1
-
1 dzień400 PLN1 dzień400 PLN
Dzień dobry. Już robiłem podobne, ale chciałbym dokładniej omówić ostateczny format zapisu. Będę zadowolony ze współpracy
-
5 dni400 PLN
332 5 dni400 PLNCześć!
Mogę zrealizować Twój projekt w Pythonie. Plan pracy jest następujący:
Parsowanie PDF z tabelami z wykorzystaniem bibliotek takich jak pdfplumber, camelot lub tabula-py.
Połączenie głównych tabel w jedną dynamiczną strukturę (na przykład listę słowników lub DataFrame), aby każdy rekord był unikalny i gotowy do przetwarzania.
Dla każdego rekordu głównej tabeli będzie przypisana szczegółowa informacja z dolnej tabeli.
…
Tworzenie dynamicznego obiektu/struktury, z którym można wygodnie pracować w Pythonie (na przykład przez pandas lub bezpośrednio jako obiekty/słownik).
Opcjonalnie: możliwość zapisywania danych w CSV/JSON do późniejszej analizy lub przetwarzania.
Realizacja będzie elastyczna, abyś mógł łatwo filtrować, analizować i modyfikować dane po parsowaniu.
Jestem gotów omówić szczegóły PDF i terminy realizacji.
-
3 dni500 PLN
1002 5 1 3 dni500 PLNDzień dobry, mogę to zrealizować i dodać AI do normalizacji, napisz na priv
-
1 dzień380 PLN
267 1 dzień380 PLNCześć,
Zakończyłem twoje zadanie. Z tekstu PDF z tabelami stworzyłem dynamiczny obiekt Pythona oraz pojedynczą scaloną tabelę podsumowującą: dwie główne tabele są połączone przez ecu_code, a dla każdego rekordu dołączona jest odpowiednia sekcja … SZCZEGÓŁY.
Wyniki:
Czysty skrypt CLI (menu/argumenty) z uporządkowanymi logami i plikiem README.
Wyniki w dwóch formatach:
… ecu_summary_merged.csv — scalone podsumowanie (główne tabele + pola „(CONT…)”).
ecu_merged.json — dynamiczny obiekt: summary_merged[] plus details{} dla ecu_code.
Zweryfikowane na twoim dokumencie: parsowanie jest spójne, pola wieloliniowe (np. CVNS) są obsługiwane.
Uruchom lokalnie (jeśli potrzebne):
python parse_ecu_pdf.py --input "Details Report.pdf" --outdir "out" --log "out/run.log"
# lub interaktywnie:
python parse_ecu_pdf.py --menu
Załączone:
parse_ecu_pdf.py
ecu_summary_merged.csv
ecu_merged.json
(opcjonalnie) krótki screencast/zrzuty ekranu
Mogę również dostarczyć wyjście XLSX i/lub minimalny interfejs webowy do przeglądania i wyszukiwania.
Pliki są gotowe do przekazania.
-
4 dni401 PLN
297 2 0 4 dni401 PLNCześć. Jestem gotów zrealizować parser dla twojego dokumentu PDF.
Zrobię:
– Odczyt i przetwarzanie głównego PDF z tabelami
– Połączenie dwóch głównych tabel w jedną
– Powiązanie z każdą rekordem swojej szczegółowej informacji
– Wyjście w postaci obiektu Python lub pandas DataFrame, z którym można łatwo pracować
Praca będzie czysta, kod zrozumiały. Napisz na priv — wszystko pokażę i ustalimy szczegóły.
-
1 dzień400 PLN
2225 32 0 1 dzień400 PLNDzień dobry. Już zrobiłem ten parser. Wszystko gotowe.
Dzień dobry. Już zrobiłem ten parser. Wszystko gotowe.
+++++++++++++++++++++++++++++++++++++++++++++
-
3 dni400 PLN
2248 63 2 2 3 dni400 PLNWitaj!
mam doświadczenie w pracy z różnymi typami danych
mogę pomóc zarówno z danymi tekstowymi, jak i z obrazami
-
1 dzień400 PLN
3298 70 1 1 dzień400 PLNWitam.
Mogę stworzyć obiekt z informacji w pdf, proponuję zrobić plik json. Mogę również zrobić w innym formacie, jeśli zajdzie taka potrzeba.
Napisz do mnie, aby omówić, w jakim formacie będzie lepiej pracować dalej z danymi.
-
3 dni400 PLN
171 3 dni400 PLNDzień dobry!
Mogę zrealizować rozwiązanie w Pythonie do parsowania PDF:
- wyciągnąć główne tabele,
- połączyć je w jedną,
- dodać szczegółowe informacje z następnych tabel,
- zapisać wynik w wygodnym formacie (na przykład, DataFrame lub JSON) do dalszej pracy.
Będę zadowolony, aby wyjaśnić szczegóły zadania i uzgodnić format finalnego wyniku.
-
1 dzień400 PLN
2426 20 0 1 dzień400 PLNDzień dobry, jestem gotów wykonać to szybko i jakościowo, napisz w wiadomościach prywatnych, omówimy szczegóły. Chętnie pomogę)
-
1 dzień400 PLN
2248 18 3 1 dzień400 PLNDzień dobry, już opracowywałem podobne parsery, zrobię z użyciem Python + pdfplumber + pandas DataFrame. Jeśli jesteś zainteresowany - pisz, z radością omówię szczegóły.
-
2 dni400 PLN
1328 35 1 2 dni400 PLNDzień dobry. Już robiłem podobny projekt. Ale w PHP. Jeśli nie jest to istotne, że PHP, proszę o kontakt, zrobię.
-
4 dni430 PLN
2788 42 1 4 dni430 PLNMoje pozdrowienia, Artem
Potrzebujesz biblioteki, do której będziesz się odwoływać ze swojego kodu Pythona, na przykład
parser -pdf path/to/my.pdf
i otrzymywać dane w ustrukturyzowanym formacie (jakaś specjalizowana klasa)?
Może się przydam..
-
1 dzień400 PLN
1495 13 0 1 dzień400 PLNCześć! Mogę to zrealizować. Napisz na prywatną wiadomość, aby omówić wszystkie szczegóły. Będę zadowolony z współpracy!
-
3 dni400 PLN
9984 117 0 3 dni400 PLNCześć.
Jestem programistą NodeJS. Jestem gotów podjąć się zadania. Pisz, omówimy.
-
1 dzień400 PLN
3008 73 4 2 1 dzień400 PLNDzień dobry! Realizuję taki parser w Pythonie!!!!!!!!!!!
Zgłaszajcie się!!!!!!
Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych
Konsultacja dotycząca parsowania subskrybentów kont InstagramWitam. Konieczne jest przeprowadzenie wstępnej oceny możliwości realizacji następującego zadania. Posiadam listę kont na Instagramie. Celem jest uzyskanie danych kontaktowych (w pierwszej kolejności adresów e-mail) użytkowników, którzy obserwują te konta. Wcześniej spotkałem… Parsowanie danych ∙ 2 dni 13 godzin temu ∙ 12 ofert |
Potrzebny specjalista do wyszukiwania kontaktów decydentów w UkrainieKonieczne jest zebranie bazy (lub gotowej bazy) kontaktów osób podejmujących decyzje (LPR) w firmach Ukrainy. Wyszukiwanie i zbieranie informacji, Parsowanie danych ∙ 2 dni 18 godzin temu ∙ 17 ofert |
Trzeba zeskrobać dane z LinkedInPotrzebujemy wyciągnąć dane z LinkedIn według naszej listy. Dla każdego wpisu należy znaleźć i zebrać dostępne dane, jeśli takie są na profilu LinkedIn, w tym zdjęcie profilowe w serwisie społecznościowym LinkedIn, adres e-mail, linki do mediów społecznościowych, stronę… Parsowanie danych ∙ 3 dni temu ∙ 27 ofert |
Parsowanie i klasyfikacja danychSzukamy dewelopera do realizacji systemu zbierania i strukturyzacji danych z otwartych źródeł. Posiadamy bazę właścicieli małych firm w USA, która zawiera imię i nazwisko, nazwę firmy, adres oraz stan. Należy zbudować proces wzbogacania tych rekordów dodatkowymi informacjami z… Programowanie stron internetowych, Parsowanie danych ∙ 3 dni 1 godzina temu ∙ 41 ofert |
Svitlahata
61 PLN
Potrzebne jest zaimportowanie 1819 produktów z pliku XML/YML Prom.ua do OpenCart 3. Jest gotowy plik XML, który zawiera nazwy produktów, opisy, ceny, zdjęcia, cechy, producentów i kategorie. Wymagane: zaimportować wszystkie produkty do OpenCart 3; utworzyć i powiązać… Content Management Systems, Parsowanie danych ∙ 4 dni 4 godziny temu ∙ 34 oferty |