Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Opublikuj swoje zlecenie za darmo i otrzymaj oferty od wykonawców freelancerów już minutę po opublikowaniu!

Programista Python do parsowania danych niestrukturalnych (Word, Excel, PDF) i synchronizacji z bazą danych w Excelu

Translated84 PLN

  1. 5248
     22  0

    7 dni2275 PLN

    Witaj! Jestem menedżerem projektu w Business Atlas. Nie piszemy kodu w Pythonie, lecz tworzymy autonomiczne systemy na n8n/Make, co jest znacznie korzystniejsze dla Twojego zadania.
    Dlaczego automatyzacja jest lepsza od skryptu:
    • Elastyczność: Jakiekolwiek zmiany w formacie plików (.pdf/.docx) będziesz mógł poprawić samodzielnie w 2 minuty bez przepisywania kodu.
    • AI-parsing: Dla tekstu nieustrukturyzowanego podłączymy API. Sztuczna inteligencja idealnie strukturyzuje dane, gdzie zwykły skrypt wygeneruje błąd.
    • Niezawodność: Wykorzystujemy doświadczenie w budowie systemów dla Ajax i Genesis. Otrzymujesz wizualną kontrolę nad każdym etapem weryfikacji.
    Jak to realizujemy:
    1. Auto-zbieranie: System sam pobiera pliki, parsuje tekst przez AI i strukturyzuje w JSON.
    2. Inteligentna weryfikacja: Automatyczne porównanie z bazą (SQL/Sheets) i natychmiastowe powiadomienie w Telegramie o rozbieżnościach.
    3. Logowanie: Pełna historia przetwarzania w wygodnej tabeli (jak w naszych przypadkach kwalifikacji danych).
    Warunki:
    • Cena: od 600 USD (pod klucz).
    • Termin: 5–7 dni.
    • Gwarancja: 14 dni wsparcia technicznego i szkolenia.
    To rozwiązanie, które łatwo skalować bez angażowania programisty. Gotowi omówić szczegóły?

  2. 18200
     28  0
    Przykład pracy:
    Telegram_Comments_2025-10-23_11-46-09 (1).xlsx
    1 dzień84 PLN

    Dzień dobry.

    Mogę opracować skrypt Python do parsowania danych z Worda, Excela i PDF, ich strukturyzacji oraz porównania z bazą danych. Pracuję z pandas, openpyxl, python-docx, pdfplumber / PyMuPDF.

    Zrealizuję:

    wyciąg danych z niestrukturalnego tekstu (regex / słowa kluczowe)

    strukturyzację w tabeli Excel

    porównanie z bazą danych według ID

    określenie brakujących lub zmienionych danych

    instrukcję i pomoc w uruchomieniu skryptu

    Na początek trzeba zobaczyć przykłady plików.

  3. 4764
     11  0

    3 dni84 PLN

    Dzień dobry.

    Zapoznałem się z Twoim zadaniem. Mogę zrealizować skrypt w Pythonie do automatyzacji przetwarzania danych z .docx, .xlsx i .pdf, z dalszym strukturyzowaniem, walidacją i porównywaniem z bazą danych. Podchodzę do takich zadań nie jako do "jednorazowego parsera pod jeden szablon", ale jako do budowy rozszerzalnego rozwiązania, które można wspierać i dostosowywać przy zmianie formatów dokumentów. W tym celu zazwyczaj zakładam oddzielne moduły do:
    czytania plików różnych typów, wyciągania pól z niestrukturalnego tekstu przez słowa kluczowe i regex, normalizacji i walidacji wartości, porównania z BD po unikalnym identyfikatorze, formowania podsumowującego wyniku po brakujących lub różniących się zapisach. Pracuję z:
    pandas, openpyxl, python-docx, PyMuPDF/pdfplumber, a także mogę podłączyć pydantic do walidacji modeli danych i rozwiązania SQL do integracji z bazą. W ramach bieżącego budżetu 1000 zł mogę zaproponować podstawową realizację MVP, która pokryje główny scenariusz:
    parsowanie plików wejściowych,
    wyciąganie kluczowych pól,
    podstawowe porównanie z BD po unikalnym polu,
    krótką instrukcję uruchomienia na Twoim komputerze.
    Jeśli będzie potrzebne bardziej uniwersalne rozwiązanie z podwyższoną elastycznością do zmian formatów, rozszerzoną walidacją, konfigurowalnymi zasadami wyszukiwania i bardziej wygodną architekturą do dalszego rozwoju — to również mogę zrealizować jako oddzielny etap.
    Co otrzymasz na wyjściu:
    ustrukturyzowany kod źródłowy,
    requirements.txt,
    instrukcję uruchomienia,
    zrozumiałą logikę działania bez "magii" w kodzie.

    Czas realizacji MVP: 2–4 dni
    Koszt: 1000 zł
    Gotowy do rozpoczęcia po uzgodnieniu przykładów plików wejściowych i struktury porównania z BD.

  4. 8272
     100  0

    1 dzień84 PLN

    Dzień dobry
    Aby ocenić, należy przejrzeć każde źródło danych i napisać pod nie skrypt.
    Moja wstępna ocena: 1000 zł za utworzenie struktury bazy + 500 zł za każde źródło danych. Jeśli źródła mają całkowicie analogiczną strukturę (na przykład wiele plików w Excelu z identyczną tabelą w środku), liczy się to jako 1 źródło.

    Proszę o kontakt.

  5. 1219
     20  0

    5 dni421 PLN

    Dzień dobry, mogę napisać taki parser. Mam tylko jedno pytanie dotyczące specyfikacji, piszecie: Skrypt musi określać:
    • Czy jest zapis w bazie?
    • Jakie informacje są nieobecne lub różnią się?
    Ale nie jest jasne, co zrobić w tych przypadkach, czy nadpisywać dane, czy ignorować, czy jeszcze coś innego? Po wyjaśnieniu specyfikacji mogę przystąpić do pracy. Przykłady prac w profilu. Terminy z poprawkami i testami pracy 3-5 dni. Cena do wyjaśnienia specyfikacji.

  6. 198  
    1 dzień93 PLN

    Witam! Jestem gotów zająć się opracowaniem skryptu Python do automatyzacji twojej bazy. Mam doświadczenie w pisaniu parserów dla niestrukturalnego tekstu, dlatego będę w stanie skonfigurować elastyczną logikę zbierania danych z .docx, .xlsx i .pdf za pomocą kombinacji wyrażeń regularnych oraz bibliotek pdfplumber i python-docx.

    Aby zapewnić stabilne działanie systemu, proponuję użycie pydantic — to pozwoli skryptowi automatycznie sprawdzać dane pod kątem błędów jeszcze przed ich porównaniem z bazą. Samą weryfikację zrealizuję za pomocą pandas, co zapewni szybkie przetwarzanie nawet dużych ilości informacji. Abyś nie musiał ciągle zmieniać kodu, wyciągnę kluczowe ustawienia wyszukiwania do osobnego pliku konfiguracyjnego.

    Na wyjściu dostarczę czysty kod z komentarzami, plik zależności requirements.txt oraz krótką instrukcję do szybkiego uruchomienia na twoim komputerze. Będę zadowolony, mogąc omówić format twojej bazy danych i przystąpić do realizacji.

  7. 615    3  0
    3 dni295 PLN

    Witam.
    W tym projekcie kluczowe jest nie tylko przeczytanie Word / Excel / PDF, ale stabilne wydobycie potrzebnych danych z różnych struktur, przekształcenie ich do jednolitego formatu i poprawna synchronizacja z aktualną bazą w Excelu.
    Pracuję z automatyzacją w Pythonie, przetwarzaniem dokumentów, mapowaniem tabel, normalizacją i walidacją danych. Dla takich zadań ważne jest nie tylko wydobycie pól, ale także stworzenie zarządzanego pipeline'u: ekstrakcja -> normalizacja -> walidacja -> porównanie -> synchronizacja.
    Proponuję zrealizować to poprzez oddzielne zasady/mapowania dla typów dokumentów, znormalizowaną pośrednią schemę i walidację przez pydantic, aby nowe lub zmienione formaty były łatwiejsze do podłączenia bez łamania całego procesu.
    Pracuję z gitem, więc mogę przekazać wynik w wygodnym formacie: kod na GitHubie / GitLabie lub w archiwum, plus instrukcję uruchomienia, requirements.txt i podstawowe ustawienia środowiska.
    Jeśli to konieczne, mogę zacząć od małego proof of concept przed zatwierdzeniem, lub na waszych próbkach: wziąć po 1 pliku Word / Excel / PDF, wydobyć kluczowe pola, pokazać znormalizowany wynik i jak dokładnie będzie wyglądać porównanie z bazą Excel lub mogę pokazać swój analogiczny system w pracy z moimi dokumentami.
    Jeśli to konieczne, odpowiem na wszystkie pytania w wiadomościach prywatnych.

  8. 478    3  0
    1 dzień84 PLN

    Proponuję rozwiązanie na AI (trzeba płacić za użycie) do strukturyzacji danych.

  9. 232  
    5 dni421 PLN

    Cześć! Mam doświadczenie w tworzeniu elastycznych narzędzi do automatyzacji przetwarzania danych i ich walidacji.

    Jak proponuję zrealizować Twój projekt:

    Parsowanie: Użyję pdfplumber do PDF oraz python-docx/openpyxl do dokumentów. Dla tekstu niestrukturalnego opracuję logikę opartą na wyrażeniach regularnych (Regex) oraz elastycznych wzorcach wyszukiwania.

    Walidacja przez Pydantic: To najlepsze rozwiązanie dla Twojego zapytania. Stworzę schematy danych, które automatycznie będą sprawdzać wprowadzane informacje pod kątem zgodności typów oraz obecności błędów jeszcze przed zapisaniem do bazy.

    Praca z bazą danych: Zrealizuję weryfikację według unikalnego identyfikatora (ID/Email/SKU), skrypt będzie generował jasny raport: co zostało dodane, co się różni, a czego brakuje.

    Elastyczność: Aby nie przepisywać kodu przy zmianie formatu, wyodrębnię logikę parsowania do oddzielnych plików konfiguracyjnych lub słowników wzorców.

    Wynik: Czysty kod w Pythonie, requirements.txt oraz szczegółowa instrukcja (README.md) dotycząca uruchamiania w izolowanym środowisku (venv).

    Jestem gotów omówić szczegóły i zaprezentować logikę przetwarzania na przykładzie jednego z Twoich plików. Czekam na feedback!

  10. 124  
    7 dni80 PLN

    Dzień dobry! 👋

    Mam doświadczenie w pracy z Pythonem oraz przetwarzaniu danych z różnych formatów plików. Mogę zrealizować skrypt, który będzie automatycznie parsował dane z **.docx, .xlsx oraz .pdf**, strukturyzował je i wykonywał **weryfikację z bazą danych według unikalnego identyfikatora**.

    Co zrobię w ramach tego zadania:
    Zrealizuję elastyczny parser z wykorzystaniem **pandas, openpyxl, python-docx oraz PyMuPDF/pdfplumber**.
    Dodam logikę wyszukiwania po **słowach kluczowych oraz wyrażeniach regularnych**, aby poprawnie przetwarzać nawet niestrukturalny tekst.
    Stworzę system **walidacji i porównania z bazą danych** (SQL lub inną — ustalimy).
    Zrealizuję sprawdzenie: czy istnieje zapis, które pola różnią się lub są brakujące.
    W razie potrzeby użyję **pydantic do walidacji danych**, aby zwiększyć niezawodność przetwarzania.

    Wynik otrzymasz w postaci:
    czystego i zrozumiałego kodu (GitHub lub archiwum),
    pliku **requirements.txt**,
    krótkiej **instrukcji uruchomienia i konfiguracji**,
    wyjaśnienia logiki działania skryptu.

    Mogę również zaproponować architekturę, która pozwoli **łatwo dostosować skrypt do zmian w formacie plików bez przepisywania kodu**.

    Jestem gotów omówić szczegóły, przykłady plików oraz format bazy danych.
    Mogę przystąpić do pracy od razu po uzgodnieniu.

  11. 690    5  0
    1 dzień84 PLN

    Cześć!
    Mogę zrealizować taki skrypt. Mam duże doświadczenie w pracy z pandas, openpyxl, python-docx, w przetwarzaniu tekstu nieustrukturyzowanego, a także w pracy z bazami danych SQL/NoSQL. Proszę, prześlij przykład plików wejściowych i strukturę bazy danych w wiadomościach prywatnych.
    Będę czekać!

  12. 1522    14  0
    1 dzień84 PLN

    Witam! Mogę to zrealizować. Proszę napisać na prywatną wiadomość, aby omówić wszystkie szczegóły. Będę zadowolony ze współpracy!

  13. 826    3  0
    4 dni211 PLN

    Gemini powiedział
    Twój wariant jest zasadniczo poprawny, ale dodajmy mu trochę więcej „ciężaru” i ekspertyzy. Klientowi ważne jest, aby zrozumiał, że bot to nie tylko „zabawa”, ale pełnoprawne profesjonalne narzędzie.

    Oto jak można to sformułować, aby brzmiało przekonująco:

    Dzień dobry! Zadanie jest całkowicie zrozumiałe, mam doświadczenie w tworzeniu podobnych parserów i systemów automatyzacji.

    Jako najbardziej wygodną opcję realizacji, proponuję zrobić to w formacie bota Telegram. To da wam kilka istotnych zalet:

    Wygoda: Nie musicie instalować Pythona, bibliotek ani konfigurować środowiska na swoim komputerze. Po prostu przesyłacie plik na czat i natychmiast otrzymujecie wynik.

    Dostępność: Skrypt będzie działał z dowolnego urządzenia (telefon, komputer stacjonarny, laptop) 24/7.

    Elastyczność: Skonfiguruję bazę danych i walidację przez Pydantic, aby system wyraźnie widział różnice między waszymi plikami a bazą danych.

    Autonomia: Pomogę wdrożyć bota na serwerze, więc nie będziecie musieli nic uruchamiać ręcznie.

    Proponuję omówić szczegóły w wiadomościach prywatnych. Byłbym wdzięczny, gdybyście przesłali przykłady plików — ważne jest dla mnie, aby zobaczyć ich strukturę, aby dokładnie ocenić złożoność parsowania i skonfigurować poprawną logikę porównania z bazą. Pozdrawiam!

  14. 601    5  0
    1 dzień84 PLN

    Witaj! Praca z danymi niestrukturalnymi to zawsze wyzwanie, które lubię. Głównym problemem takich zadań nie jest samo czytanie plików, ale to, aby skrypt nie "zepsuł się" na następnym dokumencie z powodu zbędnej spacji lub zmienionej czcionki.

  15. 764    5  1
    5 dni211 PLN

    Cześć! Mój profil to parsowanie danych nieustrukturyzowanych w Pythonie, robiłem coś podobnego. W stacku wszystko jest:
    — python-docx / openpyxl / pdfplumber — do wyciągania danych z .docx, .xlsx, .pdf
    — Adaptacyjny parser: regex + wyszukiwanie słów kluczowych dla tekstu bez wyraźnej struktury
    — Strukturyzacja w DataFrame (pandas) → podział na kolumny
    — Weryfikacja z bazą danych po unikalnym identyfikatorze: jest zapis / brak / różni się
    — Czysty kod na GitHubie + requirements.txt + krótka dokumentacja uruchomienia
    Dodatkowo: mogę dodać pydantic do walidacji i stworzyć plik konfiguracyjny, aby nie przepisywać kodu przy zmianie formatu plików wejściowych. Napisz — doprecyzuję strukturę twoich plików i bazy danych.

  16. 219  
    4 dni84 PLN

    Cześć! Zadanie jest jasne i aktualne: praca z danymi nieustrukturyzowanymi to zawsze wyzwanie dla logiki parsowania. Mam doświadczenie w pracy z wymienionym stosem (pandas, PyMuPDF, python-docx) i jestem gotów wdrożyć elastyczne rozwiązanie.

    Jak proponuję rozwiązać Twoje zadanie:

    Adaptacyjne parsowanie: Zamiast sztywnych powiązań z współrzędnymi, używam wyszukiwania po kluczowych kotwicach i wyrażeń regularnych (RegEx). To pozwoli skryptowi „przetrwać” przy niewielkich zmianach w układzie dokumentów.

    Architektura i Walidacja: Do struktury i weryfikacji danych obowiązkowo używam Pydantic. To gwarantuje, że do bazy trafią tylko ważne typy danych, a błędy będą wychwytywane na etapie parsowania, a nie zapisu.

    Porównanie z bazą danych: Wdrożę logikę „sprawdzania różnic”: skrypt będzie wyraźnie podświetlał, jakich danych brakuje, a które kolidują z aktualną bazą (używając unikalnych ID).

    Uniwersalność: Aby nie przepisywać kodu przy zmianie formatu, przeniosę ustawienia parsowania (słowa kluczowe, szablony) do oddzielnego pliku konfiguracyjnego (YAML lub JSON).

    Co otrzymasz w efekcie:

    Czysty, udokumentowany kod w Pythonie.

    requirements.txt do szybkiego uruchomienia środowiska.

    Instrukcję/rozmowę: Przeprowadzę krótkie szkolenie dotyczące uruchamiania i konfiguracji skryptu na Twoim komputerze, abyś mógł samodzielnie z nim pracować.

    Jestem gotowa omówić strukturę Twojej bazy danych i przykłady plików, aby dokładniej określić terminy i koszty.
    Twoje atuty na to stanowisko:

    Pydantic: Klient wyróżnił to jako „plus”. W odpowiedzi podkreśliłam to. To pokazuje, że piszesz nowoczesny, niezawodny kod.

    Pliki konfiguracyjne: Odpowiedź na pytanie „jak nie przepisywać kodu” — to przeniesienie ustawień do konfiguracji. To dojrzałe podejście programisty.

    Szkolenie: Akcent na tym, że nie tylko przekażesz archiwum, ale pomożesz w uruchomieniu — to usuwa lęk klienta „nie poradzę sobie z cudzym kodem”.

  17. 404    1  0
    3 dni253 PLN

    Witam, chciałbym zająć się waszym projektem. Porozmawiajmy o szczegółach osobiście.

  18. 250    37  1   2
    1 dzień337 PLN

    1 dzień - 4000 UAH
    Dzień dobry! Jestem gotów wykonać ten projekt. Duże doświadczenie w tworzeniu różnych aplikacji.

  19. 150  
    1 dzień80 PLN

    Dzień dobry, zajmuję się parsowaniem od ponad 2 lat (opracowałem projekt Ispa Parser Generator). Dobrze znam zarówno C++, jak i Pythona.

  20. 172    1  1
    1 dzień337 PLN

    Dzień dobry! Jestem gotów wykonać ten projekt. Mam duże doświadczenie w tworzeniu różnych aplikacji.

  21. 168  
    1 dzień84 PLN

    Sens gadania po prostu wezmę i zrobię, bez zbędnych słów)))))))

  22. 265  
    1 dzień84 PLN

    Dzień dobry!

    Mam duże doświadczenie w tworzeniu skryptów Python do automatyzacji przetwarzania danych, parsowania dokumentów oraz integracji z bazami danych. Pracowałem z pandas, openpyxl, python-docx, pdfplumber/PyMuPDF, a także realizowałem elastyczne parsery dla niestrukturalnych plików z wykorzystaniem wyrażeń regularnych oraz logiki wyszukiwania po kluczowych polach. Mogę zrealizować pełny pipeline: parsowanie .docx/.xlsx/.pdf, strukturyzowanie danych w tabelach, walidację oraz porównanie z bazą danych po unikalnym identyfikatorze z formowaniem zrozumiałego raportu o brakujących lub zmienionych polach. Proponuję przejść do wiadomości prywatnych, aby omówić format waszych plików, strukturę bazy danych oraz uzgodnić koszt i terminy realizacji.

  23. 1562    7  0
    1 dzień84 PLN

    Wchodzę do top-10 deweloperów w kategorii „Sztuczna inteligencja i uczenie maszynowe” wśród ~2100 specjalistów na platformie. Gwarantuję: - Szybkie i jakościowe wykonanie zadania - Ścisłe przestrzeganie terminów - Regularny kontakt przez cały proces Będę zadowolony, aby omówić szczegóły twojego projektu w prywatnych wiadomościach.

  24. 4028    11  0   2
    1 dzień84 PLN

    Witam. Jestem gotów opracować skrypt w Pythonie do parsowania danych z .docx, .xlsx i .pdf, ich strukturyzacji, walidacji oraz porównania z bazą danych. Mam doświadczenie w pracy z Pythonem, pandas, openpyxl, przetwarzaniu dokumentów, parsowaniu danych nieustrukturyzowanych, wyrażeniami regularnymi oraz budowie zrozumiałej logiki przetwarzania. Mogę również wdrożyć elastyczną architekturę, aby przy zmianie formatu plików nie było konieczności całkowitego przepisywania kodu. Co mogę zrobić w ramach projektu: parsowanie danych z różnych formatów; rozkładanie informacji po potrzebnych polach; porównanie z bazą danych według unikalnego identyfikatora; wykrywanie brakujących lub zmienionych danych; przygotowanie instrukcji uruchamiania i konfiguracji; w razie potrzeby — krótki instruktaż dotyczący pracy ze skryptem.

  25. 687    8  0
    30 dni253 PLN

    Na Borland Delphi można napisać.

    Z Excelem jest trochę trudniej, ponieważ tam jest różna
    liczba kolumn. To znaczy osobny program.

    Mam wiedzę z Pythona. Ale nie ma pewności, że będę to stosować w tym zadaniu.

  26. 417    2  0
    3 dni253 PLN
  27. 358    1  0
    1 dzień84 PLN

    Dzień dobry!
    Mam doświadczenie w pracy z parsowaniem danych w formatach .docx, .xlsx i .pdf, wcześniej realizowałem automatyzację dla procesów księgowych. Chciałbym doprecyzować szczegóły dotyczące samych dokumentów — jak bardzo mogą się różnić pod względem struktury, aby prawidłowo wprowadzić adaptacyjną logikę przetwarzania.

    Mogę zaproponować nie tylko skrypt, ale także rozwiązanie GUI do wygodnego zarządzania procesem (ładowanie plików, uruchamianie przetwarzania, przeglądanie wyników). Oczywiście, zostanie przygotowana pełna dokumentacja projektu z instrukcjami uruchamiania i konfiguracji.

    Oto mój GitHub do zapoznania się z przykładami prac: [https://github.com/NazarShubeliak].

  28. 588    0  1
    10 dni84 PLN

    Witam, opracowuję skrypty do parsowania danych w celu wydobycia różnych formatów dokumentów, za pomocą Pythona (pandas, pdfplumber, python-docx). Mogę zapisać dane w formacie parquet lub stworzyć bazę danych w postrgesql. Jeśli potrzebujesz serwera, jestem gotów go stworzyć na Dockerze. Po pomyślnej realizacji umieszczę na githubie z instrukcją instalacji.

  29. 2138    22  2
    10 dni843 PLN

    cześć
    mam doświadczenie w podobnych projektach
    1. czy można zobaczyć przykład danych? trzeba zrozumieć, czy możliwe jest wyciągnięcie informacji z tych plików.
    2. trzeba również zrozumieć, czy dane można zorganizować w zwykły sposób, czy będzie konieczne użycie sztucznej inteligencji.
    3. najlepiej zapakować projekt w Dockera, będzie można wygodnie korzystać.

    piszcie, omówimy szczegóły

  30. 2211    18  3
    1 dzień84 PLN

    Witam! Mogę zrealizować taki parser. Pracuję z Pythonem (pandas, pdfplumber, pydantic).

    Moje podejście: zamiast kruchych wyrażeń regularnych dla niestrukturalnego tekstu proponuję wykorzystanie integracji AI. To gwarantuje, że skrypt znajdzie potrzebne pola, nawet jeśli ich kolejność w pliku się zmieni. Dla Excela i danych strukturalnych pozostawiamy klasyczne przetwarzanie dla szybkości.

    Zrobię jasną dokumentację, abyś mógł uruchomić skrypt bez mojej pomocy. Czekam na przykłady plików do omówienia ostatecznej ceny.

  31. 656    9  0
    1 dzień84 PLN

    Dzień dobry, Rostysław!
    Ogólnie zadanie jest zrozumiałe, aby uzyskać dokładną odpowiedź na temat terminów i ceny, chciałbym wyjaśnić kilka kwestii, które pojawiły się po analizie twojego zadania.
    Pisz w prywatnych wiadomościach – omówimy szczegóły i twoje życzenia.

  32. Nick Osipov Web4Business
    4975    41  4   1
    3 dni84 PLN

    Dzień dobry!

    Profesjonalnie opracowuję rozwiązania w Pythonie do parsowania danych niestrukturalnych (Word, Excel, PDF) oraz synchronizacji z bazą danych. Mam doświadczenie z pandas, openpyxl, python-docx, PyMuPDF oraz adaptacyjnymi parserami.

    Napisz do mnie w wiadomości prywatnej, omówimy szczegóły projektu.

  33. 284  
    3 dni270 PLN

    Cześć! Mam doświadczenie w tworzeniu adaptacyjnych parserów do nieustrukturyzowanego tekstu (Regex + logika kluczy).

    Mój sposób podejścia do twojego zadania:

    Stos: pdfplumber i python-docx do czystego wyciągu danych; pydantic do walidacji przed zapisaniem do bazy danych.

    Elastyczność: Wyciągnę ustawienia (pola, słowa kluczowe) do pliku konfiguracyjnego, abyś mógł dostosować skrypt do nowych plików bez edytowania kodu.

    Synchronizacja: Ustawię jasną logikę porównania z bazą danych według ID (logika UPSERT), abyś widział rozbieżności i brakujące rekordy.

    Wynik: Czysty kod z komentarzami + requirements.txt + wideo instrukcja uruchomienia na twoim komputerze.

    Jestem gotowa omówić szczegóły i przejrzeć przykłady plików w wiadomościach prywatnych!

  34. 1251    35  1   3
    1 dzień94 PLN

    Witam, jestem gotów to zrobić. Mam całe niezbędne doświadczenie w pracy z bibliotekami i plikami. Proszę przesłać mi pliki na prywatną wiadomość, dokładnie je przejrzę.

  35. 1239    16  0
    1 dzień84 PLN

    Witam!
    Ogólnie specjalizuję się w scraperach i parserach, więc mogę wykonać Twoje zadanie. Prawda, chciałbym najpierw spojrzeć na przykłady plików wejściowych, aby zrozumieć stopień "złożoności" danych wejściowych. Właściwie to wpłynie na cenę i termin (obecnie podane są dowolne).
    Przekażę skrypty w wygodnej formie, wyjaśnię działanie, w razie potrzeby pomogę w konfiguracji środowiska.

  36. 691    5  0
    1 dzień80 PLN

    Witam! Zainteresował mnie Twój projekt. Mam duże doświadczenie w:

    📊 Przetwarzanie danych: praca z bazami, strukturyzacja i analiza informacji, automatyzacja przetwarzania dużych ilości danych, import/eksport i walidacja;
    🤖 Automatyzacja i emulacja działań użytkownika; rozwój botów o różnym stopniu skomplikowania;
    ⚡️ Asynchroniczne i wielowątkowe parsowanie: zbieranie i przetwarzanie danych z optymalizacją wydajności;
    🔍 OCR i wyszukiwanie tekstu: rozpoznawanie i strukturyzacja informacji;
    🖼 Przetwarzanie mediów: praca z obrazami i multimediami;
    🖥 Rozwój oprogramowania, aplikacji desktopowych, usług systemowych i serwisów;
    📱 Rozwój mobilny: aplikacje natywne i wieloplatformowe;
    🌐 Praca z API i zewnętrznymi usługami: integracja, automatyzacja i wymiana danych;
    🗣 Tłumaczenie i przetwarzanie tekstu: automatyzacja tłumaczenia, praca z modelami językowymi i analizą tekstu;
    🤖 Rozwiązania AI/LLM: integracja i wykorzystanie sztucznej inteligencji, praca z modelami językowymi i automatyzacja procesów inteligentnych.

    Wykonam pracę szybko i jakościowo. Skontaktuj się ze mną, aby omówić szczegóły i terminy realizacji projektu!

  37. 2506    20  0
    1 dzień126 PLN

    Dzień dobry, jestem gotowy wykonać twoje zadanie szybko i jakościowo. Mam duże doświadczenie w tworzeniu różnych parserów. Napisz w wiadomościach prywatnych, omówimy szczegóły. Chętnie pomogę)

  38. Jeszcze 8 ofert jest ukrytych
  1. 426    10  2
    3 dni253 PLN

    Cześć!
    Mam doświadczenie w pracy z podobnymi zadaniami.
    Mogę napisać adaptacyjny skrypt, podłączyć do niego OpenAI API, co poprawi przetwarzanie dokumentów o słabej jakości.
    Piszcie na prywatne, wszystko omówimy.

  2. 390  
    10 dni843 PLN

    Mam doświadczenie w parsowaniu Pythonem Word, Excel i PDF, w tym z tekstem niestrukturalnym. Używam pandas, openpyxl, python-docx, PyMuPDF/pdfplumber, wyrażeń regularnych oraz logiki słów kluczowych do dokładnego wydobywania danych.

    Mogę stworzyć skrypt, który:

    adaptacyjnie parsuje różne formaty plików,

    strukturyzuje dane według pól,

    porównuje z bazą danych (SQL/NoSQL) i wykrywa brakujące lub różne rekordy,

    zawiera dokumentację i instrukcję do uruchomienia.

    Jestem gotów zaproponować rozwiązanie, które jest łatwe w utrzymaniu i skalowalne w zależności od zmian formatów plików.

  3. 1 oferta jest ukryta
  • Hennadii Y.
    14 marca, 0:02 |

    Може краще 700 грн? Бо наче 1000 дорогувато за такий простий скрипт, хай чатгопота сгенеруй, впорається за 2 хвилини 🤣🤣🤣

  • Rostyslav Kovach
    14 marca, 0:10 |

    Я гадаю тут гпт не поможе бо ж сам у ньому не мало часу сидів

  • Aleksandr Petrov
    15 marca, 20:06 |

    я сдавая бутылки в Германии в день больше зарабатываю😂

  • Rostyslav Kovach
    15 marca, 20:07 |

    Ти на правильному шляху, хай щастить!

Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych

Parsowanie produktów, przygotowanie do importu na WP

Wydobyć pełny katalog tych stron: https://svit-mebliv.ua/ https://kompanit.com.ua/ru https://amia.com.ua/ https://mebliromax.com.ua/ https://pehotin.com.ua/catalog/ https://www.sokme.ua/ru/ Wszystkie produkty muszą być połączone w jedną wspólną tabelę do importu do WP. Każdy…

Programowanie stron internetowychParsowanie danych ∙ 2 godziny 10 minut temu ∙ 26 ofert

Szukam programisty do OpenCart

Dzień dobry 1) należy wdrożyć na stronie dneprkomfort.dp.uazakupiono moduł dla ukraińskich banków, już wdrożono Monto bank oto przykład naszego konkurenta Trzeba zrobić rozłożenie na raty, zakupy na raty (Monto Bank) Pumb, Sens, Monto domyślnie 2 płatności na 2 miesiące Pumb…

Programowanie stron internetowychParsowanie danych ∙ 23 godziny 30 minut temu ∙ 46 ofert

Wymagany specjalista ds. promocji w Telegramie.

107 PLN

Zadania: zapraszanie rzeczywistych użytkowników z bazy nazw użytkowników do nowych czatów oraz wysyłanie wiadomości do docelowej bazy. Interesuje nas tylko jakościowy ruch i praca z żywą publicznością — wykonawców korzystających z botów, sztucznego zwiększania lub niskiej…

Parsowanie danychPromocja w sieciach społecznościowych (SMM) ∙ 5 dni 1 godzina temu ∙ 9 ofert

Konsultacja dotycząca parsowania subskrybentów kont Instagram

Witam. Konieczne jest przeprowadzenie wstępnej oceny możliwości realizacji następującego zadania. Posiadam listę kont na Instagramie. Celem jest uzyskanie danych kontaktowych (w pierwszej kolejności adresów e-mail) użytkowników, którzy obserwują te konta. Wcześniej spotkałem…

Parsowanie danych ∙ 8 dni 20 godzin temu ∙ 13 ofert

Potrzebny specjalista do wyszukiwania kontaktów decydentów w Ukrainie

Konieczne jest zebranie bazy (lub gotowej bazy) kontaktów osób podejmujących decyzje (LPR) w firmach Ukrainy.

Wyszukiwanie i zbieranie informacjiParsowanie danych ∙ 9 dni 1 godzina temu ∙ 21 ofert

Zleceniodawca
Zlecenie zostało opublikowane
3 miesiące 12 dni temu
3 miesiące 10 dni
420 wyświetleń
Tagi
  • pandas
  • openpyxl
  • python
  • SQL
  • python-docx
  • PyMuPDF