Zlecenia dla freelancerów

Zlecenia dla freelancerów

Programista Python do parsowania danych niestrukturalnych (Word, Excel, PDF) i synchronizacji z bazą danych w Excelu

Parsowanie danych, Python — podano nieprawidłowe kategorie?

85 PLN

Zlecenie jest tłumaczone automatycznie. Zaloguj się lub zarejestruj się, żeby zobaczyć oryginał

Opis zadania:
Należy opracować skrypt w Pythonie do automatyzacji przetwarzania danych wejściowych z różnych formatów oraz ich weryfikacji z istniejącą bazą danych.
Główne etapy pracy:
1. Parsowanie: Wyciąganie danych z plików .docx, .xlsx i .pdf. Tekst nie zawsze ma wyraźną strukturę, dlatego skrypt musi być adaptacyjny (użycie wyrażeń regularnych lub logiki wyszukiwania według słów kluczowych).
2. Strukturyzacja: Rozdzielenie uzyskanych informacji na odpowiednie kolumny (pola).
3. Walidacja i porównanie: Weryfikacja wyników z bazą danych według unikalnego identyfikatora. Skrypt musi określić:
• Czy rekord znajduje się w bazie?
• Jakie informacje są brakujące lub różnią się?
4. Szkolenie: Krótkie wprowadzenie lub dokumentacja dotycząca uruchamiania i konfiguracji skryptu na moim komputerze.
Wymagania dla kandydata:
• Doświadczenie w pracy z bibliotekami: pandas, openpyxl, python-docx, PyMuPDF (lub pdfplumber).
• Umiejętność pracy z bazami danych (SQL lub NoSQL — doprecyzujemy w trakcie).
• Doświadczenie w pisaniu elastycznych parserów dla tekstu nieustrukturyzowanego.
• Zdolność do jasnego wyjaśnienia logiki działania kodu.
Będzie plusem:
• Doświadczenie w pracy z pydantic do walidacji danych.
• Propozycje dotyczące tego, jak lepiej obsługiwać zmiany w formacie plików bez ciągłego przepisywania kodu.
Format wyniku:
Kod źródłowy na GitHub/GitLab lub w archiwum + instrukcja uruchomienia (requirements.txt, konfiguracja środowiska).
Cena do uzgodnienia

Oferty 45 Odrzucone 3 Dyskusje 4

Oleg M.

22 0

Budżet: 27000 UAH Termin: 7 dni

Witaj! Jestem menedżerem projektu w Business Atlas. Nie piszemy kodu w Pythonie, lecz tworzymy autonomiczne systemy na n8n/Make, co jest znacznie korzystniejsze dla Twojego zadania.
Dlaczego automatyzacja jest lepsza od skryptu:
• Elastyczność: Jakiekolwiek zmiany w formacie plików (.pdf/.docx) będziesz mógł poprawić samodzielnie w 2 minuty bez przepisywania kodu.
• AI-parsing: Dla tekstu nieustrukturyzowanego podłączymy API. Sztuczna inteligencja idealnie strukturyzuje dane, gdzie zwykły skrypt wygeneruje błąd.
• Niezawodność: Wykorzystujemy doświadczenie w budowie systemów dla Ajax i Genesis. Otrzymujesz wizualną kontrolę nad każdym etapem weryfikacji.
Jak to realizujemy:
1. Auto-zbieranie: System sam pobiera pliki, parsuje tekst przez AI i strukturyzuje w JSON.
2. Inteligentna weryfikacja: Automatyczne porównanie z bazą (SQL/Sheets) i natychmiastowe powiadomienie w Telegramie o rozbieżnościach.
3. Logowanie: Pełna historia przetwarzania w wygodnej tabeli (jak w naszych przypadkach kwalifikacji danych).
Warunki:
• Cena: od 600 USD (pod klucz).
• Termin: 5–7 dni.
• Gwarancja: 14 dni wsparcia technicznego i szkolenia.
To rozwiązanie, które łatwo skalować bez angażowania programisty. Gotowi omówić szczegóły?

Mixail Lutsckiy

12 0

Budżet: 1000 UAH Termin: 3 dni

Dzień dobry.

Zapoznałem się z Twoim zadaniem. Mogę zrealizować skrypt w Pythonie do automatyzacji przetwarzania danych z .docx, .xlsx i .pdf, z dalszym strukturyzowaniem, walidacją i porównywaniem z bazą danych. Podchodzę do takich zadań nie jako do "jednorazowego parsera pod jeden szablon", ale jako do budowy rozszerzalnego rozwiązania, które można wspierać i dostosowywać przy zmianie formatów dokumentów. W tym celu zazwyczaj zakładam oddzielne moduły do:
czytania plików różnych typów, wyciągania pól z niestrukturalnego tekstu przez słowa kluczowe i regex, normalizacji i walidacji wartości, porównania z BD po unikalnym identyfikatorze, formowania podsumowującego wyniku po brakujących lub różniących się zapisach. Pracuję z:
pandas, openpyxl, python-docx, PyMuPDF/pdfplumber, a także mogę podłączyć pydantic do walidacji modeli danych i rozwiązania SQL do integracji z bazą. W ramach bieżącego budżetu 1000 zł mogę zaproponować podstawową realizację MVP, która pokryje główny scenariusz:
parsowanie plików wejściowych,
wyciąganie kluczowych pól,
podstawowe porównanie z BD po unikalnym polu,
krótką instrukcję uruchomienia na Twoim komputerze.
Jeśli będzie potrzebne bardziej uniwersalne rozwiązanie z podwyższoną elastycznością do zmian formatów, rozszerzoną walidacją, konfigurowalnymi zasadami wyszukiwania i bardziej wygodną architekturą do dalszego rozwoju — to również mogę zrealizować jako oddzielny etap.
Co otrzymasz na wyjściu:
ustrukturyzowany kod źródłowy,
requirements.txt,
instrukcję uruchomienia,
zrozumiałą logikę działania bez "magii" w kodzie.

Czas realizacji MVP: 2–4 dni
Koszt: 1000 zł
Gotowy do rozpoczęcia po uzgodnieniu przykładów plików wejściowych i struktury porównania z BD.

Vitalii Zhovnirchyk

100 0

Budżet: 1000 UAH Termin: 1 dzień

Dzień dobry
Aby ocenić, należy przejrzeć każde źródło danych i napisać pod nie skrypt.
Moja wstępna ocena: 1000 zł za utworzenie struktury bazy + 500 zł za każde źródło danych. Jeśli źródła mają całkowicie analogiczną strukturę (na przykład wiele plików w Excelu z identyczną tabelą w środku), liczy się to jako 1 źródło.

Proszę o kontakt.

Vasyl Kravchenko

0 0

Zlecenia -
Ocena -
Ranking 198

Budżet: 1100 UAH Termin: 1 dzień

Witam! Jestem gotów zająć się opracowaniem skryptu Python do automatyzacji twojej bazy. Mam doświadczenie w pisaniu parserów dla niestrukturalnego tekstu, dlatego będę w stanie skonfigurować elastyczną logikę zbierania danych z .docx, .xlsx i .pdf za pomocą kombinacji wyrażeń regularnych oraz bibliotek pdfplumber i python-docx.

Aby zapewnić stabilne działanie systemu, proponuję użycie pydantic — to pozwoli skryptowi automatycznie sprawdzać dane pod kątem błędów jeszcze przed ich porównaniem z bazą. Samą weryfikację zrealizuję za pomocą pandas, co zapewni szybkie przetwarzanie nawet dużych ilości informacji. Abyś nie musiał ciągle zmieniać kodu, wyciągnę kluczowe ustawienia wyszukiwania do osobnego pliku konfiguracyjnego.

Na wyjściu dostarczę czysty kod z komentarzami, plik zależności requirements.txt oraz krótką instrukcję do szybkiego uruchomienia na twoim komputerze. Będę zadowolony, mogąc omówić format twojej bazy danych i przystąpić do realizacji.

Dmytro Zavadskyi

4 0

Budżet: 3500 UAH Termin: 3 dni

Witam.
W tym projekcie kluczowe jest nie tylko przeczytanie Word / Excel / PDF, ale stabilne wydobycie potrzebnych danych z różnych struktur, przekształcenie ich do jednolitego formatu i poprawna synchronizacja z aktualną bazą w Excelu.
Pracuję z automatyzacją w Pythonie, przetwarzaniem dokumentów, mapowaniem tabel, normalizacją i walidacją danych. Dla takich zadań ważne jest nie tylko wydobycie pól, ale także stworzenie zarządzanego pipeline'u: ekstrakcja -> normalizacja -> walidacja -> porównanie -> synchronizacja.
Proponuję zrealizować to poprzez oddzielne zasady/mapowania dla typów dokumentów, znormalizowaną pośrednią schemę i walidację przez pydantic, aby nowe lub zmienione formaty były łatwiejsze do podłączenia bez łamania całego procesu.
Pracuję z gitem, więc mogę przekazać wynik w wygodnym formacie: kod na GitHubie / GitLabie lub w archiwum, plus instrukcję uruchomienia, requirements.txt i podstawowe ustawienia środowiska.
Jeśli to konieczne, mogę zacząć od małego proof of concept przed zatwierdzeniem, lub na waszych próbkach: wziąć po 1 pliku Word / Excel / PDF, wydobyć kluczowe pola, pokazać znormalizowany wynik i jak dokładnie będzie wyglądać porównanie z bazą Excel lub mogę pokazać swój analogiczny system w pracy z moimi dokumentami.
Jeśli to konieczne, odpowiem na wszystkie pytania w wiadomościach prywatnych.

Andrii Khrystoforov

3 0

Zlecenia 3
Ocena -
Ranking 478

Budżet: 1000 UAH Termin: 1 dzień

Proponuję rozwiązanie na AI (trzeba płacić za użycie) do strukturyzacji danych.

Yehor Tarasov

0 0

Zlecenia -
Ocena -
Ranking 232

Budżet: 5000 UAH Termin: 5 dni

Cześć! Mam doświadczenie w tworzeniu elastycznych narzędzi do automatyzacji przetwarzania danych i ich walidacji.

Jak proponuję zrealizować Twój projekt:

Parsowanie: Użyję pdfplumber do PDF oraz python-docx/openpyxl do dokumentów. Dla tekstu niestrukturalnego opracuję logikę opartą na wyrażeniach regularnych (Regex) oraz elastycznych wzorcach wyszukiwania.

Walidacja przez Pydantic: To najlepsze rozwiązanie dla Twojego zapytania. Stworzę schematy danych, które automatycznie będą sprawdzać wprowadzane informacje pod kątem zgodności typów oraz obecności błędów jeszcze przed zapisaniem do bazy.

Praca z bazą danych: Zrealizuję weryfikację według unikalnego identyfikatora (ID/Email/SKU), skrypt będzie generował jasny raport: co zostało dodane, co się różni, a czego brakuje.

Elastyczność: Aby nie przepisywać kodu przy zmianie formatu, wyodrębnię logikę parsowania do oddzielnych plików konfiguracyjnych lub słowników wzorców.

Wynik: Czysty kod w Pythonie, requirements.txt oraz szczegółowa instrukcja (README.md) dotycząca uruchamiania w izolowanym środowisku (venv).

Jestem gotów omówić szczegóły i zaprezentować logikę przetwarzania na przykładzie jednego z Twoich plików. Czekam na feedback!

Heorhii Semishkur

0 0

Zlecenia -
Ocena -
Ranking 100

Budżet: 950 UAH Termin: 7 dni

Dzień dobry! 👋

Mam doświadczenie w pracy z Pythonem oraz przetwarzaniu danych z różnych formatów plików. Mogę zrealizować skrypt, który będzie automatycznie parsował dane z **.docx, .xlsx oraz .pdf**, strukturyzował je i wykonywał **weryfikację z bazą danych według unikalnego identyfikatora**.

Co zrobię w ramach tego zadania:
Zrealizuję elastyczny parser z wykorzystaniem **pandas, openpyxl, python-docx oraz PyMuPDF/pdfplumber**.
Dodam logikę wyszukiwania po **słowach kluczowych oraz wyrażeniach regularnych**, aby poprawnie przetwarzać nawet niestrukturalny tekst.
Stworzę system **walidacji i porównania z bazą danych** (SQL lub inną — ustalimy).
Zrealizuję sprawdzenie: czy istnieje zapis, które pola różnią się lub są brakujące.
W razie potrzeby użyję **pydantic do walidacji danych**, aby zwiększyć niezawodność przetwarzania.

Wynik otrzymasz w postaci:
czystego i zrozumiałego kodu (GitHub lub archiwum),
pliku **requirements.txt**,
krótkiej **instrukcji uruchomienia i konfiguracji**,
wyjaśnienia logiki działania skryptu.

Mogę również zaproponować architekturę, która pozwoli **łatwo dostosować skrypt do zmian w formacie plików bez przepisywania kodu**.

Jestem gotów omówić szczegóły, przykłady plików oraz format bazy danych.
Mogę przystąpić do pracy od razu po uzgodnieniu.

Iryna P.

5 0

Budżet: 1000 UAH Termin: 1 dzień

Cześć!
Mogę zrealizować taki skrypt. Mam duże doświadczenie w pracy z pandas, openpyxl, python-docx, w przetwarzaniu tekstu nieustrukturyzowanego, a także w pracy z bazami danych SQL/NoSQL. Proszę, prześlij przykład plików wejściowych i strukturę bazy danych w wiadomościach prywatnych.
Będę czekać!

Oleksandr Z.

14 0

Budżet: 1000 UAH Termin: 1 dzień

Witam! Mogę to zrealizować. Proszę napisać na prywatną wiadomość, aby omówić wszystkie szczegóły. Będę zadowolony ze współpracy!

Oleg Kit

3 0

Budżet: 2500 UAH Termin: 4 dni

Gemini powiedział
Twój wariant jest zasadniczo poprawny, ale dodajmy mu trochę więcej „ciężaru” i ekspertyzy. Klientowi ważne jest, aby zrozumiał, że bot to nie tylko „zabawa”, ale pełnoprawne profesjonalne narzędzie.

Oto jak można to sformułować, aby brzmiało przekonująco:

Dzień dobry! Zadanie jest całkowicie zrozumiałe, mam doświadczenie w tworzeniu podobnych parserów i systemów automatyzacji.

Jako najbardziej wygodną opcję realizacji, proponuję zrobić to w formacie bota Telegram. To da wam kilka istotnych zalet:

Wygoda: Nie musicie instalować Pythona, bibliotek ani konfigurować środowiska na swoim komputerze. Po prostu przesyłacie plik na czat i natychmiast otrzymujecie wynik.

Dostępność: Skrypt będzie działał z dowolnego urządzenia (telefon, komputer stacjonarny, laptop) 24/7.

Elastyczność: Skonfiguruję bazę danych i walidację przez Pydantic, aby system wyraźnie widział różnice między waszymi plikami a bazą danych.

Autonomia: Pomogę wdrożyć bota na serwerze, więc nie będziecie musieli nic uruchamiać ręcznie.

Proponuję omówić szczegóły w wiadomościach prywatnych. Byłbym wdzięczny, gdybyście przesłali przykłady plików — ważne jest dla mnie, aby zobaczyć ich strukturę, aby dokładnie ocenić złożoność parsowania i skonfigurować poprawną logikę porównania z bazą. Pozdrawiam!

Kostyantin Y.

6 0

Budżet: 1000 UAH Termin: 1 dzień

Witaj! Praca z danymi niestrukturalnymi to zawsze wyzwanie, które lubię. Głównym problemem takich zadań nie jest samo czytanie plików, ale to, aby skrypt nie "zepsuł się" na następnym dokumencie z powodu zbędnej spacji lub zmienionej czcionki.

Daniil Skrebets

5 1

Budżet: 2500 UAH Termin: 5 dni

Cześć! Mój profil to parsowanie danych nieustrukturyzowanych w Pythonie, robiłem coś podobnego. W stacku wszystko jest:
— python-docx / openpyxl / pdfplumber — do wyciągania danych z .docx, .xlsx, .pdf
— Adaptacyjny parser: regex + wyszukiwanie słów kluczowych dla tekstu bez wyraźnej struktury
— Strukturyzacja w DataFrame (pandas) → podział na kolumny
— Weryfikacja z bazą danych po unikalnym identyfikatorze: jest zapis / brak / różni się
— Czysty kod na GitHubie + requirements.txt + krótka dokumentacja uruchomienia
Dodatkowo: mogę dodać pydantic do walidacji i stworzyć plik konfiguracyjny, aby nie przepisywać kodu przy zmianie formatu plików wejściowych. Napisz — doprecyzuję strukturę twoich plików i bazy danych.

Vlad V.

0 0

Zlecenia -
Ocena -
Ranking 195

Budżet: 1000 UAH Termin: 4 dni

Cześć! Zadanie jest jasne i aktualne: praca z danymi nieustrukturyzowanymi to zawsze wyzwanie dla logiki parsowania. Mam doświadczenie w pracy z wymienionym stosem (pandas, PyMuPDF, python-docx) i jestem gotów wdrożyć elastyczne rozwiązanie.

Jak proponuję rozwiązać Twoje zadanie:

Adaptacyjne parsowanie: Zamiast sztywnych powiązań z współrzędnymi, używam wyszukiwania po kluczowych kotwicach i wyrażeń regularnych (RegEx). To pozwoli skryptowi „przetrwać” przy niewielkich zmianach w układzie dokumentów.

Architektura i Walidacja: Do struktury i weryfikacji danych obowiązkowo używam Pydantic. To gwarantuje, że do bazy trafią tylko ważne typy danych, a błędy będą wychwytywane na etapie parsowania, a nie zapisu.

Porównanie z bazą danych: Wdrożę logikę „sprawdzania różnic”: skrypt będzie wyraźnie podświetlał, jakich danych brakuje, a które kolidują z aktualną bazą (używając unikalnych ID).

Uniwersalność: Aby nie przepisywać kodu przy zmianie formatu, przeniosę ustawienia parsowania (słowa kluczowe, szablony) do oddzielnego pliku konfiguracyjnego (YAML lub JSON).

Co otrzymasz w efekcie:

Czysty, udokumentowany kod w Pythonie.

requirements.txt do szybkiego uruchomienia środowiska.

Instrukcję/rozmowę: Przeprowadzę krótkie szkolenie dotyczące uruchamiania i konfiguracji skryptu na Twoim komputerze, abyś mógł samodzielnie z nim pracować.

Jestem gotowa omówić strukturę Twojej bazy danych i przykłady plików, aby dokładniej określić terminy i koszty.
Twoje atuty na to stanowisko:

Pydantic: Klient wyróżnił to jako „plus”. W odpowiedzi podkreśliłam to. To pokazuje, że piszesz nowoczesny, niezawodny kod.

Pliki konfiguracyjne: Odpowiedź na pytanie „jak nie przepisywać kodu” — to przeniesienie ustawień do konfiguracji. To dojrzałe podejście programisty.

Szkolenie: Akcent na tym, że nie tylko przekażesz archiwum, ale pomożesz w uruchomieniu — to usuwa lęk klienta „nie poradzę sobie z cudzym kodem”.

Stanislav S.

1 0

Zlecenia -
Ocena -
Ranking 380

Budżet: 3000 UAH Termin: 3 dni

Witam, chciałbym zająć się waszym projektem. Porozmawiajmy o szczegółach osobiście.

Aleksey Stasevich

37 1

Zlecenia 38
Ocena -
Ranking 250

Budżet: 4000 UAH Termin: 1 dzień

1 dzień - 4000 UAH
Dzień dobry! Jestem gotów wykonać ten projekt. Duże doświadczenie w tworzeniu różnych aplikacji.

Yuriy V.

0 0

Zlecenia -
Ocena -
Ranking 126

Budżet: 950 UAH Termin: 1 dzień

Dzień dobry, zajmuję się parsowaniem od ponad 2 lat (opracowałem projekt Ispa Parser Generator). Dobrze znam zarówno C++, jak i Pythona.

Mykyta S.

32 0

Budżet: 1000 UAH Termin: 1 dzień

Dzień dobry.

Mogę opracować skrypt Python do parsowania danych z Worda, Excela i PDF, ich strukturyzacji oraz porównania z bazą danych. Pracuję z pandas, openpyxl, python-docx, pdfplumber / PyMuPDF.

Zrealizuję:

wyciąg danych z niestrukturalnego tekstu (regex / słowa kluczowe)

strukturyzację w tabeli Excel

porównanie z bazą danych według ID

określenie brakujących lub zmienionych danych

instrukcję i pomoc w uruchomieniu skryptu

Na początek trzeba zobaczyć przykłady plików.

Załączona praca:

Telegram_Comments_2025-10-23_11-46-09 (1).xlsx

Dmytro Zmenkov

1 1

Zlecenia -
Ocena -
Ranking 121

Budżet: 4000 UAH Termin: 1 dzień

Dzień dobry! Jestem gotów wykonać ten projekt. Mam duże doświadczenie w tworzeniu różnych aplikacji.

Bogdan Prokopenko

0 0

Zlecenia -
Ocena -
Ranking 144

Budżet: 1000 UAH Termin: 1 dzień

Sens gadania po prostu wezmę i zrobię, bez zbędnych słów)))))))

Yaroslav C.

0 0

Zlecenia -
Ocena -
Ranking 265

Budżet: 1000 UAH Termin: 1 dzień

Dzień dobry!

Mam duże doświadczenie w tworzeniu skryptów Python do automatyzacji przetwarzania danych, parsowania dokumentów oraz integracji z bazami danych. Pracowałem z pandas, openpyxl, python-docx, pdfplumber/PyMuPDF, a także realizowałem elastyczne parsery dla niestrukturalnych plików z wykorzystaniem wyrażeń regularnych oraz logiki wyszukiwania po kluczowych polach. Mogę zrealizować pełny pipeline: parsowanie .docx/.xlsx/.pdf, strukturyzowanie danych w tabelach, walidację oraz porównanie z bazą danych po unikalnym identyfikatorze z formowaniem zrozumiałego raportu o brakujących lub zmienionych polach. Proponuję przejść do wiadomości prywatnych, aby omówić format waszych plików, strukturę bazy danych oraz uzgodnić koszt i terminy realizacji.

Roman Z.

7 0

Budżet: 1000 UAH Termin: 1 dzień

Wchodzę do top-10 deweloperów w kategorii „Sztuczna inteligencja i uczenie maszynowe” wśród ~2100 specjalistów na platformie. Gwarantuję: - Szybkie i jakościowe wykonanie zadania - Ścisłe przestrzeganie terminów - Regularny kontakt przez cały proces Będę zadowolony, aby omówić szczegóły twojego projektu w prywatnych wiadomościach.

Sergiy Turenko

11 0

Budżet: 1000 UAH Termin: 1 dzień

Witam. Jestem gotów opracować skrypt w Pythonie do parsowania danych z .docx, .xlsx i .pdf, ich strukturyzacji, walidacji oraz porównania z bazą danych. Mam doświadczenie w pracy z Pythonem, pandas, openpyxl, przetwarzaniu dokumentów, parsowaniu danych nieustrukturyzowanych, wyrażeniami regularnymi oraz budowie zrozumiałej logiki przetwarzania. Mogę również wdrożyć elastyczną architekturę, aby przy zmianie formatu plików nie było konieczności całkowitego przepisywania kodu. Co mogę zrobić w ramach projektu: parsowanie danych z różnych formatów; rozkładanie informacji po potrzebnych polach; porównanie z bazą danych według unikalnego identyfikatora; wykrywanie brakujących lub zmienionych danych; przygotowanie instrukcji uruchamiania i konfiguracji; w razie potrzeby — krótki instruktaż dotyczący pracy ze skryptem.

Pavlo I.

8 0

Budżet: 3000 UAH Termin: 30 dni

Na Borland Delphi można napisać.

Z Excelem jest trochę trudniej, ponieważ tam jest różna
liczba kolumn. To znaczy osobny program.

Mam wiedzę z Pythona. Ale nie ma pewności, że będę to stosować w tym zadaniu.

Sergey Petrenko

2 0

Zlecenia -
Ocena -
Ranking 417

Budżet: 2998 UAH Termin: 3 dni

Witaj

Google Drive

Nazar Shubeliak

1 0

Zlecenia -
Ocena -
Ranking 358

Budżet: 1000 UAH Termin: 1 dzień

Dzień dobry!
Mam doświadczenie w pracy z parsowaniem danych w formatach .docx, .xlsx i .pdf, wcześniej realizowałem automatyzację dla procesów księgowych. Chciałbym doprecyzować szczegóły dotyczące samych dokumentów — jak bardzo mogą się różnić pod względem struktury, aby prawidłowo wprowadzić adaptacyjną logikę przetwarzania.

Mogę zaproponować nie tylko skrypt, ale także rozwiązanie GUI do wygodnego zarządzania procesem (ładowanie plików, uruchamianie przetwarzania, przeglądanie wyników). Oczywiście, zostanie przygotowana pełna dokumentacja projektu z instrukcjami uruchamiania i konfiguracji.

Oto mój GitHub do zapoznania się z przykładami prac: [https://github.com/NazarShubeliak].

Max Adamchuk

0 1

Zlecenia -
Ocena -
Ranking 568

Budżet: 1000 UAH Termin: 10 dni

Witam, opracowuję skrypty do parsowania danych w celu wydobycia różnych formatów dokumentów, za pomocą Pythona (pandas, pdfplumber, python-docx). Mogę zapisać dane w formacie parquet lub stworzyć bazę danych w postrgesql. Jeśli potrzebujesz serwera, jestem gotów go stworzyć na Dockerze. Po pomyślnej realizacji umieszczę na githubie z instrukcją instalacji.

Serhii Gavka

22 2

Zlecenia 23
Ocena -
Ranking 2 114

Budżet: 10000 UAH Termin: 10 dni

cześć
mam doświadczenie w podobnych projektach
1. czy można zobaczyć przykład danych? trzeba zrozumieć, czy możliwe jest wyciągnięcie informacji z tych plików.
2. trzeba również zrozumieć, czy dane można zorganizować w zwykły sposób, czy będzie konieczne użycie sztucznej inteligencji.
3. najlepiej zapakować projekt w Dockera, będzie można wygodnie korzystać.

piszcie, omówimy szczegóły

Viktor Piven

18 3

Budżet: 1000 UAH Termin: 1 dzień

Witam! Mogę zrealizować taki parser. Pracuję z Pythonem (pandas, pdfplumber, pydantic).

Moje podejście: zamiast kruchych wyrażeń regularnych dla niestrukturalnego tekstu proponuję wykorzystanie integracji AI. To gwarantuje, że skrypt znajdzie potrzebne pola, nawet jeśli ich kolejność w pliku się zmieni. Dla Excela i danych strukturalnych pozostawiamy klasyczne przetwarzanie dla szybkości.

Zrobię jasną dokumentację, abyś mógł uruchomić skrypt bez mojej pomocy. Czekam na przykłady plików do omówienia ostatecznej ceny.

Dmitry B.

20 0

Budżet: 5000 UAH Termin: 5 dni

Dzień dobry, mogę napisać taki parser. Mam tylko jedno pytanie dotyczące specyfikacji, piszecie: Skrypt musi określać:
• Czy jest zapis w bazie?
• Jakie informacje są nieobecne lub różnią się?
Ale nie jest jasne, co zrobić w tych przypadkach, czy nadpisywać dane, czy ignorować, czy jeszcze coś innego? Po wyjaśnieniu specyfikacji mogę przystąpić do pracy. Przykłady prac w profilu. Terminy z poprawkami i testami pracy 3-5 dni. Cena do wyjaśnienia specyfikacji.

Ihor Doronin

9 0

Budżet: 1000 UAH Termin: 1 dzień

Dzień dobry, Rostysław!
Ogólnie zadanie jest zrozumiałe, aby uzyskać dokładną odpowiedź na temat terminów i ceny, chciałbym wyjaśnić kilka kwestii, które pojawiły się po analizie twojego zadania.
Pisz w prywatnych wiadomościach – omówimy szczegóły i twoje życzenia.

Nick Osipov

41 4

Budżet: 1000 UAH Termin: 3 dni

Dzień dobry!

Profesjonalnie opracowuję rozwiązania w Pythonie do parsowania danych niestrukturalnych (Word, Excel, PDF) oraz synchronizacji z bazą danych. Mam doświadczenie z pandas, openpyxl, python-docx, PyMuPDF oraz adaptacyjnymi parserami.

Napisz do mnie w wiadomości prywatnej, omówimy szczegóły projektu.

Anna K.

0 0

Zlecenia -
Ocena -
Ranking 260

Budżet: 3200 UAH Termin: 3 dni

Cześć! Mam doświadczenie w tworzeniu adaptacyjnych parserów do nieustrukturyzowanego tekstu (Regex + logika kluczy).

Mój sposób podejścia do twojego zadania:

Stos: pdfplumber i python-docx do czystego wyciągu danych; pydantic do walidacji przed zapisaniem do bazy danych.

Elastyczność: Wyciągnę ustawienia (pola, słowa kluczowe) do pliku konfiguracyjnego, abyś mógł dostosować skrypt do nowych plików bez edytowania kodu.

Synchronizacja: Ustawię jasną logikę porównania z bazą danych według ID (logika UPSERT), abyś widział rozbieżności i brakujące rekordy.

Wynik: Czysty kod z komentarzami + requirements.txt + wideo instrukcja uruchomienia na twoim komputerze.

Jestem gotowa omówić szczegóły i przejrzeć przykłady plików w wiadomościach prywatnych!

Vladislav T.

35 1

Budżet: 1111 UAH Termin: 1 dzień

Witam, jestem gotów to zrobić. Mam całe niezbędne doświadczenie w pracy z bibliotekami i plikami. Proszę przesłać mi pliki na prywatną wiadomość, dokładnie je przejrzę.

Serhii Klitynskyi

16 0

Budżet: 1000 UAH Termin: 1 dzień

Witam!
Ogólnie specjalizuję się w scraperach i parserach, więc mogę wykonać Twoje zadanie. Prawda, chciałbym najpierw spojrzeć na przykłady plików wejściowych, aby zrozumieć stopień "złożoności" danych wejściowych. Właściwie to wpłynie na cenę i termin (obecnie podane są dowolne).
Przekażę skrypty w wygodnej formie, wyjaśnię działanie, w razie potrzeby pomogę w konfiguracji środowiska.

Vladislav Bozhenko

5 0

Budżet: 950 UAH Termin: 1 dzień

Witam! Zainteresował mnie Twój projekt. Mam duże doświadczenie w:

📊 Przetwarzanie danych: praca z bazami, strukturyzacja i analiza informacji, automatyzacja przetwarzania dużych ilości danych, import/eksport i walidacja;
🤖 Automatyzacja i emulacja działań użytkownika; rozwój botów o różnym stopniu skomplikowania;
⚡️ Asynchroniczne i wielowątkowe parsowanie: zbieranie i przetwarzanie danych z optymalizacją wydajności;
🔍 OCR i wyszukiwanie tekstu: rozpoznawanie i strukturyzacja informacji;
🖼 Przetwarzanie mediów: praca z obrazami i multimediami;
🖥 Rozwój oprogramowania, aplikacji desktopowych, usług systemowych i serwisów;
📱 Rozwój mobilny: aplikacje natywne i wieloplatformowe;
🌐 Praca z API i zewnętrznymi usługami: integracja, automatyzacja i wymiana danych;
🗣 Tłumaczenie i przetwarzanie tekstu: automatyzacja tłumaczenia, praca z modelami językowymi i analizą tekstu;
🤖 Rozwiązania AI/LLM: integracja i wykorzystanie sztucznej inteligencji, praca z modelami językowymi i automatyzacja procesów inteligentnych.

Wykonam pracę szybko i jakościowo. Skontaktuj się ze mną, aby omówić szczegóły i terminy realizacji projektu!

Dmytro Parkhomenko

20 0

Budżet: 1500 UAH Termin: 1 dzień

Dzień dobry, jestem gotowy wykonać twoje zadanie szybko i jakościowo. Mam duże doświadczenie w tworzeniu różnych parserów. Napisz w wiadomościach prywatnych, omówimy szczegóły. Chętnie pomogę)

Vladimir K.

10 2

Budżet: 3000 UAH Termin: 3 dni

Cześć!
Mam doświadczenie w pracy z podobnymi zadaniami.
Mogę napisać adaptacyjny skrypt, podłączyć do niego OpenAI API, co poprawi przetwarzanie dokumentów o słabej jakości.
Piszcie na prywatne, wszystko omówimy.

Volodymyr Mahdyk

0 0

Zlecenia -
Ocena -
Ranking 390

Budżet: 10000 UAH Termin: 10 dni

Mam doświadczenie w parsowaniu Pythonem Word, Excel i PDF, w tym z tekstem niestrukturalnym. Używam pandas, openpyxl, python-docx, PyMuPDF/pdfplumber, wyrażeń regularnych oraz logiki słów kluczowych do dokładnego wydobywania danych.

Mogę stworzyć skrypt, który:

adaptacyjnie parsuje różne formaty plików,

strukturyzuje dane według pól,

porównuje z bazą danych (SQL/NoSQL) i wykrywa brakujące lub różne rekordy,

zawiera dokumentację i instrukcję do uruchomienia.

Jestem gotów zaproponować rozwiązanie, które jest łatwe w utrzymaniu i skalowalne w zależności od zmian formatów plików.

Hennadii Y. 14 marca

Може краще 700 грн? Бо наче 1000 дорогувато за такий простий скрипт, хай чатгопота сгенеруй, впорається за 2 хвилини 🤣🤣🤣

Rostyslav Kovach

14 marca

Я гадаю тут гпт не поможе бо ж сам у ньому не мало часу сидів

Aleksandr Petrov 15 marca

я сдавая бутылки в Германии в день больше зарабатываю😂

Rostyslav Kovach

15 marca

Ти на правильному шляху, хай щастить!

Dodaj komentarz

Rostyslav Kovach
Kijów, Ukraina

Zleceń -
Ocena -
Ranking 20

Oleg M.

Mixail Lutsckiy

Vitalii Zhovnirchyk

Vasyl Kravchenko

Dmytro Zavadskyi

Andrii Khrystoforov

Yehor Tarasov

Heorhii Semishkur

Iryna P.

Oleksandr Z.

Oleg Kit

Kostyantin Y.

Daniil Skrebets

Vlad V.

Stanislav S.

Aleksey Stasevich

Yuriy V.

Mykyta S.

Dmytro Zmenkov

Bogdan Prokopenko

Yaroslav C.

Roman Z.

Sergiy Turenko

Pavlo I.

Sergey Petrenko

Nazar Shubeliak

Max Adamchuk

Serhii Gavka

Viktor Piven

Dmitry B.

Ihor Doronin

Nick Osipov

Anna K.

Vladislav T.

Serhii Klitynskyi

Vladislav Bozhenko

Dmytro Parkhomenko

Oferty ukryte

Aktualnie brak ofert

Vladimir K.

Volodymyr Mahdyk

Oferty ukryte

Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych