Opracowanie parsera dokumentu PDF (jedna forma)
Zadanie: opracować parser dokumentów PDF (jedna forma)
Opis zadania:
Jest dokument PDF o stałej strukturze (ta sama forma).
Należy napisać skrypt, który:
- Wyciąga dane z określonych pól (w dokumencie są zarówno tekst, jak i obrazy/skanowane części);
- Formuje wynik w JSON-modelu (ustrukturyzowany zbiór danych);
Wymagania:
- Doświadczenie w pracy z dokumentami PDF, gdzie są teksty i obrazy (mile widziana znajomość OCR);
- Kod powinien być zrozumiały i prosty w użyciu;
- Technologie — według uznania programisty (Python, Node.js, itp.).
Format wyniku:
- Źródłowy kod (skrypt/program);
- Przykład pliku JSON z wynikiem.
Termin: jak najszybciej 🙂
Budżet: minimalny (proszę o propozycje).
Załączniki 1
-
1 dzień95 PLN1 dzień95 PLN
Gotowy zrealizować twoje zadanie na Pythonie w ciągu dnia: maksymalnie szybko i wygodnie, z możliwością użycia bezpośrednio z twojego PC. Zaczynamy?
-
1 dzień95 PLN
250 1 dzień95 PLNMogę szybko opracować parser pod waszą formę: Python z PyMuPDF do tekstu i do zbierania obrazków, z eksportem do JSON. Na wyjściu otrzymacie czysty skrypt, README i przykładem gotowego JSON;
-
2 dni189 PLN
166 2 dni189 PLNCześć. Nazywam się Władysław, jestem studentem na kierunku Inżynieria Oprogramowania. Uczyłem się pisania parserów z użyciem Pythona. Jestem gotów podjąć się pracy, aby zrobić to jak najszybciej i wzbogacić swoje portfolio o tego rodzaju projekty.
-
7 dni567 PLN
1315 7 0 7 dni567 PLNDzień dobry.
Jestem gotów zająć się Twoim projektem.
Mogę opracować dla Ciebie taki parser przy pomocy narzędzi no-code/low-code.
Napisz w wiadomości prywatnej, omówimy wszystkie szczegóły i dobierzemy dla Ciebie najlepsze rozwiązanie.
-
3 dni189 PLN
166 3 dni189 PLNCześć! 👋
Mogę opracować parser dokumentów PDF o stałej strukturze, który będzie:
odczytywał pola tekstowe,
w razie potrzeby — rozpoznawał dane z zeskanowanych części (OCR przez Tesseract),
tworzył strukturalny plik JSON z wynikiem.
…
Piszę w Pythonie (biblioteki pdfplumber, PyMuPDF, pytesseract). Kod będzie czysty, z przykładem użycia.
-
1 dzień189 PLN
3066 23 1 3 1 dzień189 PLNCześć, Andriej! Rozwiązanie problemu wydobywania danych z PDF to nie tylko techniczne wyzwanie, ale także możliwość uczynienia procesu pracy maksymalnie efektywnym i zautomatyzowanym. Wykorzystując doświadczenie w tworzeniu parserów i integracji technologii OCR, zaproponuję skrypt, który uchwyci wszystkie niezbędne dane i przekonwertuje je na schludny JSON. Kod będzie łatwy w utrzymaniu i adaptacji, opierając się na najlepszych praktykach rozwoju Full-Stack. Rozumiem znaczenie szybkości i jestem gotów zapewnić jak najszybszy wynik. Omówmy szczegóły i zacznijmy pracować nad tym przydatnym narzędziem?
-
1 dzień95 PLN
176 1 0 1 dzień95 PLNCześć! Potrafię pracować z dokumentami PDF, w tym z wyodrębnianiem tekstu i danych za pomocą OCR. Zadanie jest jasne, struktura jest stała. Budżet mi odpowiada. Jestem gotów do natychmiastowego rozpoczęcia.
-
1 dzień95 PLN
264 1 dzień95 PLNCześć!
Doświadczony programista Node.js, specjalizuję się w parsowaniu dokumentów PDF i automatyzacji przetwarzania danych.
Co mogę zaoferować:
Opracowanie niezawodnego parsera dla PDF o stałej strukturze (w tym zeskanowane dokumenty);
Ekstrakcja tekstu i obrazów za pomocą OCR (Tesseract, AWS Textract, Google Vision);
… Tworzenie czystego modelu danych JSON według wcześniej uzgodnionej struktury;
Szybka konfiguracja pod konkretny formularz i zrozumiały, łatwo rozszerzalny kod.
-
1 dzień189 PLN
9927 117 0 1 dzień189 PLNWitam.
Robię parsery w NodeJS. Jestem gotów się tym zająć. Piszcie, omówimy.
-
1 dzień95 PLN
511 3 0 1 dzień95 PLNCześć. Jestem gotów zrobić to w Pythonie. Mam doświadczenie w pracy z parserami, w tym z PDF. Jeśli jesteś gotów do dyskusji - pisz na priv.
-
2 dni284 PLN
3305 70 1 2 dni284 PLNCześć.
Stworzę parser, będę używać Node.js
Jestem gotów do dyskusji
-
3 dni95 PLN
690 5 1 3 dni95 PLNDzień dobry!
Jestem gotowy zająć się Państwa projektem. Dokładnie przeanalizowałem dostarczony przykład (raport kredytowy NBUK) i mam dla Państwa dobre wieści.
Dokument ma cyfrową podstawę tekstową, a nie jest zeskanowanym obrazem. Oznacza to, że do wydobycia danych nie jest potrzebne OCR (optyczne rozpoznawanie znaków). To znacznie upraszcza zadanie, gwarantuje 100% dokładność rozpoznawania tekstu.
Jestem gotowy omówić szczegóły w wiadomości prywatnej.
-
3 dni284 PLN
957 5 0 1 3 dni284 PLNDzień dobry.
Jestem gotów opracować dla Państwa stabilny skrypt, który będzie działał bez przerwy, wcześniej realizowałem projekt, w którym pracowałem z plikami PDF w kodzie.
Proszę pisać w prywatnych wiadomościach w celu omówienia wszystkich szczegółów.
Będę zadowolony ze współpracy!
-
1 dzień95 PLN
147 1 0 1 dzień95 PLNDzień dobry!
Jestem gotów stworzyć parser dokumentu w Pythonie z zapisywaniem danych w JSON.
-
2 dni757 PLN
264 2 dni757 PLNDzień dobry
Napiszę skrypt w PHP, mam gotowe swoje funkcje do analizy PDF, mam ogromne doświadczenie.
-
1 dzień95 PLN
2211 18 3 1 dzień95 PLNDzień dobry. Zajmuję się automatyzacją procesów w Pythonie. Mam doświadczenie w przetwarzaniu danych w plikach PDF, a także doświadczenie w pracy z OCR. Aby ostatecznie ocenić terminy i ceny, chciałbym usłyszeć więcej szczegółów na temat pól, z którymi będziemy pracować, to również pomoże ocenić interakcję z OCR, niektóre usługi mają dość hojne darmowe taryfy. Piszcie - z przyjemnością omówię wszystko i pomogę.
-
1 dzień95 PLN
656 9 0 1 dzień95 PLNDzień dobry, Andrey!
Ogólnie zadanie jest zrozumiałe, aby uzyskać dokładną odpowiedź na temat terminów i ceny, chciałbym wyjaśnić kilka kwestii, które pojawiły się po analizie twojego zadania.
Pisz w wiadomościach prywatnych – omówimy szczegóły i twoje życzenia.
Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych
Sparsować bazę i dodać do czatu w TGWydobyć bazę z List ua i dodać według numerów do czatu na Telegramie. Czat na temat remontu i designu wnętrz. Parsowanie danych, Praca z klientami ∙ 21 minut temu ∙ 9 ofert |
Należy opracować bota Telegram do monitorowania samochodów z aukcji w USA (Copart, IAAI)Należy stworzyć bota Telegram do automatycznego wyszukiwania i monitorowania samochodów "BUY IT NOW" na aukcjach w USA (Copart, IAAI). Bot powinien działać w trybie automatycznym i wysyłać powiadomienia o nowych samochodach, które odpowiadają zadanym filtrom.Podstawowa… Parsowanie danych, Tworzenie chatbota ∙ 7 godzin 54 minuty temu ∙ 59 ofert |
Parsowanie produktów, przygotowanie do importu na WPWydobyć pełny katalog tych stron: https://svit-mebliv.ua/ https://kompanit.com.ua/ru https://amia.com.ua/ https://mebliromax.com.ua/ https://pehotin.com.ua/catalog/ https://www.sokme.ua/ru/ Wszystkie produkty muszą być połączone w jedną wspólną tabelę do importu do WP. Każdy… Programowanie stron internetowych, Parsowanie danych ∙ 3 dni temu ∙ 57 ofert |
Wymagany specjalista ds. promocji w Telegramie.
107 PLN
Zadania: zapraszanie rzeczywistych użytkowników z bazy nazw użytkowników do nowych czatów oraz wysyłanie wiadomości do docelowej bazy. Interesuje nas tylko jakościowy ruch i praca z żywą publicznością — wykonawców korzystających z botów, sztucznego zwiększania lub niskiej… Parsowanie danych, Promocja w sieciach społecznościowych (SMM) ∙ 8 dni temu ∙ 9 ofert |
Konsultacja dotycząca parsowania subskrybentów kont InstagramWitam. Konieczne jest przeprowadzenie wstępnej oceny możliwości realizacji następującego zadania. Posiadam listę kont na Instagramie. Celem jest uzyskanie danych kontaktowych (w pierwszej kolejności adresów e-mail) użytkowników, którzy obserwują te konta. Wcześniej spotkałem… Parsowanie danych ∙ 11 dni 19 godzin temu ∙ 13 ofert |