Opracowanie parsera dokumentu PDF (jedna forma)
Zadanie: opracować parser dokumentów PDF (jedna forma)
Opis zadania:
Jest dokument PDF o stałej strukturze (ta sama forma).
Należy napisać skrypt, który:
- Wyciąga dane z określonych pól (w dokumencie są zarówno tekst, jak i obrazy/skanowane części);
- Formuje wynik w JSON-modelu (ustrukturyzowany zbiór danych);
Wymagania:
- Doświadczenie w pracy z dokumentami PDF, gdzie są teksty i obrazy (mile widziana znajomość OCR);
- Kod powinien być zrozumiały i prosty w użyciu;
- Technologie — według uznania programisty (Python, Node.js, itp.).
Format wyniku:
- Źródłowy kod (skrypt/program);
- Przykład pliku JSON z wynikiem.
Termin: jak najszybciej 🙂
Budżet: minimalny (proszę o propozycje).
Załączniki 1
-
1 dzień95 PLN1 dzień95 PLN
Gotowy zrealizować twoje zadanie na Pythonie w ciągu dnia: maksymalnie szybko i wygodnie, z możliwością użycia bezpośrednio z twojego PC. Zaczynamy?
-
1 dzień95 PLN
250 1 dzień95 PLNMogę szybko opracować parser pod waszą formę: Python z PyMuPDF do tekstu i do zbierania obrazków, z eksportem do JSON. Na wyjściu otrzymacie czysty skrypt, README i przykładem gotowego JSON;
-
2 dni189 PLN
166 2 dni189 PLNCześć. Nazywam się Władysław, jestem studentem na kierunku Inżynieria Oprogramowania. Uczyłem się pisania parserów z użyciem Pythona. Jestem gotów podjąć się pracy, aby zrobić to jak najszybciej i wzbogacić swoje portfolio o tego rodzaju projekty.
-
7 dni567 PLN
1315 7 0 7 dni567 PLNDzień dobry.
Jestem gotów zająć się Twoim projektem.
Mogę opracować dla Ciebie taki parser przy pomocy narzędzi no-code/low-code.
Napisz w wiadomości prywatnej, omówimy wszystkie szczegóły i dobierzemy dla Ciebie najlepsze rozwiązanie.
-
3 dni189 PLN
166 3 dni189 PLNCześć! 👋
Mogę opracować parser dokumentów PDF o stałej strukturze, który będzie:
odczytywał pola tekstowe,
w razie potrzeby — rozpoznawał dane z zeskanowanych części (OCR przez Tesseract),
tworzył strukturalny plik JSON z wynikiem.
…
Piszę w Pythonie (biblioteki pdfplumber, PyMuPDF, pytesseract). Kod będzie czysty, z przykładem użycia.
-
1 dzień189 PLN
3066 23 1 3 1 dzień189 PLNCześć, Andriej! Rozwiązanie problemu wydobywania danych z PDF to nie tylko techniczne wyzwanie, ale także możliwość uczynienia procesu pracy maksymalnie efektywnym i zautomatyzowanym. Wykorzystując doświadczenie w tworzeniu parserów i integracji technologii OCR, zaproponuję skrypt, który uchwyci wszystkie niezbędne dane i przekonwertuje je na schludny JSON. Kod będzie łatwy w utrzymaniu i adaptacji, opierając się na najlepszych praktykach rozwoju Full-Stack. Rozumiem znaczenie szybkości i jestem gotów zapewnić jak najszybszy wynik. Omówmy szczegóły i zacznijmy pracować nad tym przydatnym narzędziem?
-
1 dzień95 PLN
176 1 0 1 dzień95 PLNCześć! Potrafię pracować z dokumentami PDF, w tym z wyodrębnianiem tekstu i danych za pomocą OCR. Zadanie jest jasne, struktura jest stała. Budżet mi odpowiada. Jestem gotów do natychmiastowego rozpoczęcia.
-
1 dzień95 PLN
264 1 dzień95 PLNCześć!
Doświadczony programista Node.js, specjalizuję się w parsowaniu dokumentów PDF i automatyzacji przetwarzania danych.
Co mogę zaoferować:
Opracowanie niezawodnego parsera dla PDF o stałej strukturze (w tym zeskanowane dokumenty);
Ekstrakcja tekstu i obrazów za pomocą OCR (Tesseract, AWS Textract, Google Vision);
… Tworzenie czystego modelu danych JSON według wcześniej uzgodnionej struktury;
Szybka konfiguracja pod konkretny formularz i zrozumiały, łatwo rozszerzalny kod.
-
1 dzień189 PLN
9927 117 0 1 dzień189 PLNWitam.
Robię parsery w NodeJS. Jestem gotów się tym zająć. Piszcie, omówimy.
-
1 dzień95 PLN
511 3 0 1 dzień95 PLNCześć. Jestem gotów zrobić to w Pythonie. Mam doświadczenie w pracy z parserami, w tym z PDF. Jeśli jesteś gotów do dyskusji - pisz na priv.
-
2 dni284 PLN
3305 70 1 2 dni284 PLNCześć.
Stworzę parser, będę używać Node.js
Jestem gotów do dyskusji
-
3 dni95 PLN
690 5 1 3 dni95 PLNDzień dobry!
Jestem gotowy zająć się Państwa projektem. Dokładnie przeanalizowałem dostarczony przykład (raport kredytowy NBUK) i mam dla Państwa dobre wieści.
Dokument ma cyfrową podstawę tekstową, a nie jest zeskanowanym obrazem. Oznacza to, że do wydobycia danych nie jest potrzebne OCR (optyczne rozpoznawanie znaków). To znacznie upraszcza zadanie, gwarantuje 100% dokładność rozpoznawania tekstu.
Jestem gotowy omówić szczegóły w wiadomości prywatnej.
-
3 dni284 PLN
957 5 0 1 3 dni284 PLNDzień dobry.
Jestem gotów opracować dla Państwa stabilny skrypt, który będzie działał bez przerwy, wcześniej realizowałem projekt, w którym pracowałem z plikami PDF w kodzie.
Proszę pisać w prywatnych wiadomościach w celu omówienia wszystkich szczegółów.
Będę zadowolony ze współpracy!
-
1 dzień95 PLN
147 1 0 1 dzień95 PLNDzień dobry!
Jestem gotów stworzyć parser dokumentu w Pythonie z zapisywaniem danych w JSON.
-
2 dni757 PLN
264 2 dni757 PLNDzień dobry
Napiszę skrypt w PHP, mam gotowe swoje funkcje do analizy PDF, mam ogromne doświadczenie.
-
1 dzień95 PLN
2211 18 3 1 dzień95 PLNDzień dobry. Zajmuję się automatyzacją procesów w Pythonie. Mam doświadczenie w przetwarzaniu danych w plikach PDF, a także doświadczenie w pracy z OCR. Aby ostatecznie ocenić terminy i ceny, chciałbym usłyszeć więcej szczegółów na temat pól, z którymi będziemy pracować, to również pomoże ocenić interakcję z OCR, niektóre usługi mają dość hojne darmowe taryfy. Piszcie - z przyjemnością omówię wszystko i pomogę.
-
1 dzień95 PLN
656 9 0 1 dzień95 PLNDzień dobry, Andrey!
Ogólnie zadanie jest zrozumiałe, aby uzyskać dokładną odpowiedź na temat terminów i ceny, chciałbym wyjaśnić kilka kwestii, które pojawiły się po analizie twojego zadania.
Pisz w wiadomościach prywatnych – omówimy szczegóły i twoje życzenia.
Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych
Parsowanie produktów, przygotowanie do importu na WPWydobyć pełny katalog tych stron: https://svit-mebliv.ua/ https://kompanit.com.ua/ru https://amia.com.ua/ https://mebliromax.com.ua/ https://pehotin.com.ua/catalog/ https://www.sokme.ua/ru/ Wszystkie produkty muszą być połączone w jedną wspólną tabelę do importu do WP. Każdy… Programowanie stron internetowych, Parsowanie danych ∙ 2 dni 3 godziny temu ∙ 54 oferty |
Szukam programisty do OpenCartDzień dobry 1) należy wdrożyć na stronie dneprkomfort.dp.uazakupiono moduł dla ukraińskich banków, już wdrożono Monto bank oto przykład naszego konkurenta Trzeba zrobić rozłożenie na raty, zakupy na raty (Monto Bank) Pumb, Sens, Monto domyślnie 2 płatności na 2 miesiące Pumb… Programowanie stron internetowych, Parsowanie danych ∙ 3 dni 1 godzina temu ∙ 48 ofert |
Wymagany specjalista ds. promocji w Telegramie.
107 PLN
Zadania: zapraszanie rzeczywistych użytkowników z bazy nazw użytkowników do nowych czatów oraz wysyłanie wiadomości do docelowej bazy. Interesuje nas tylko jakościowy ruch i praca z żywą publicznością — wykonawców korzystających z botów, sztucznego zwiększania lub niskiej… Parsowanie danych, Promocja w sieciach społecznościowych (SMM) ∙ 7 dni 3 godziny temu ∙ 9 ofert |
Konsultacja dotycząca parsowania subskrybentów kont InstagramWitam. Konieczne jest przeprowadzenie wstępnej oceny możliwości realizacji następującego zadania. Posiadam listę kont na Instagramie. Celem jest uzyskanie danych kontaktowych (w pierwszej kolejności adresów e-mail) użytkowników, którzy obserwują te konta. Wcześniej spotkałem… Parsowanie danych ∙ 10 dni 22 godziny temu ∙ 13 ofert |
Potrzebny specjalista do wyszukiwania kontaktów decydentów w UkrainieKonieczne jest zebranie bazy (lub gotowej bazy) kontaktów osób podejmujących decyzje (LPR) w firmach Ukrainy. Wyszukiwanie i zbieranie informacji, Parsowanie danych ∙ 11 dni 2 godziny temu ∙ 22 oferty |