Programista Python do parsowania danych niestrukturalnych (Word, Excel, PDF) i synchronizacji z bazą danych w Excelu
Opis zadania:
Należy opracować skrypt w Pythonie do automatyzacji przetwarzania danych wejściowych z różnych formatów oraz ich weryfikacji z istniejącą bazą danych.
Główne etapy pracy:
1. Parsowanie: Wyciąganie danych z plików .docx, .xlsx i .pdf. Tekst nie zawsze ma wyraźną strukturę, dlatego skrypt musi być adaptacyjny (użycie wyrażeń regularnych lub logiki wyszukiwania według słów kluczowych).
2. Strukturyzacja: Rozdzielenie uzyskanych informacji na odpowiednie kolumny (pola).
3. Walidacja i porównanie: Weryfikacja wyników z bazą danych według unikalnego identyfikatora. Skrypt musi określić:
• Czy rekord znajduje się w bazie?
• Jakie informacje są brakujące lub różnią się?
4. Szkolenie: Krótkie wprowadzenie lub dokumentacja dotycząca uruchamiania i konfiguracji skryptu na moim komputerze.
Wymagania dla kandydata:
• Doświadczenie w pracy z bibliotekami: pandas, openpyxl, python-docx, PyMuPDF (lub pdfplumber).
• Umiejętność pracy z bazami danych (SQL lub NoSQL — doprecyzujemy w trakcie).
• Doświadczenie w pisaniu elastycznych parserów dla tekstu nieustrukturyzowanego.
• Zdolność do jasnego wyjaśnienia logiki działania kodu.
Będzie plusem:
• Doświadczenie w pracy z pydantic do walidacji danych.
• Propozycje dotyczące tego, jak lepiej obsługiwać zmiany w formacie plików bez ciągłego przepisywania kodu.
Format wyniku:
Kod źródłowy na GitHub/GitLab lub w archiwum + instrukcja uruchomienia (requirements.txt, konfiguracja środowiska).
Cena do uzgodnienia
-
Witaj! Jestem menedżerem projektu w Business Atlas. Nie piszemy kodu w Pythonie, lecz tworzymy autonomiczne systemy na n8n/Make, co jest znacznie korzystniejsze dla Twojego zadania.
Dlaczego automatyzacja jest lepsza od skryptu:
• Elastyczność: Jakiekolwiek zmiany w formacie plików (.pdf/.docx) będziesz mógł poprawić samodzielnie w 2 minuty bez przepisywania kodu.
• AI-parsing: Dla tekstu nieustrukturyzowanego podłączymy API. Sztuczna inteligencja idealnie strukturyzuje dane, gdzie zwykły skrypt wygeneruje błąd.
• Niezawodność: Wykorzystujemy doświadczenie w budowie systemów dla Ajax i Genesis. Otrzymujesz wizualną kontrolę nad każdym etapem weryfikacji.
Jak to realizujemy:
1. Auto-zbieranie: System sam pobiera pliki, parsuje tekst przez AI i strukturyzuje w JSON.
2. Inteligentna weryfikacja: Automatyczne porównanie z bazą (SQL/Sheets) i natychmiastowe powiadomienie w Telegramie o rozbieżnościach.
3. Logowanie: Pełna historia przetwarzania w wygodnej tabeli (jak w naszych przypadkach kwalifikacji danych).
… Warunki:
• Cena: od 600 USD (pod klucz).
• Termin: 5–7 dni.
• Gwarancja: 14 dni wsparcia technicznego i szkolenia.
To rozwiązanie, które łatwo skalować bez angażowania programisty. Gotowi omówić szczegóły?
-
Dzień dobry.
Mogę opracować skrypt Python do parsowania danych z Worda, Excela i PDF, ich strukturyzacji oraz porównania z bazą danych. Pracuję z pandas, openpyxl, python-docx, pdfplumber / PyMuPDF.
Zrealizuję:
wyciąg danych z niestrukturalnego tekstu (regex / słowa kluczowe)
strukturyzację w tabeli Excel
…
porównanie z bazą danych według ID
określenie brakujących lub zmienionych danych
instrukcję i pomoc w uruchomieniu skryptu
Na początek trzeba zobaczyć przykłady plików.
-
Dzień dobry.
Zapoznałem się z Twoim zadaniem. Mogę zrealizować skrypt w Pythonie do automatyzacji przetwarzania danych z .docx, .xlsx i .pdf, z dalszym strukturyzowaniem, walidacją i porównywaniem z bazą danych. Podchodzę do takich zadań nie jako do "jednorazowego parsera pod jeden szablon", ale jako do budowy rozszerzalnego rozwiązania, które można wspierać i dostosowywać przy zmianie formatów dokumentów. W tym celu zazwyczaj zakładam oddzielne moduły do:
czytania plików różnych typów, wyciągania pól z niestrukturalnego tekstu przez słowa kluczowe i regex, normalizacji i walidacji wartości, porównania z BD po unikalnym identyfikatorze, formowania podsumowującego wyniku po brakujących lub różniących się zapisach. Pracuję z:
pandas, openpyxl, python-docx, PyMuPDF/pdfplumber, a także mogę podłączyć pydantic do walidacji modeli danych i rozwiązania SQL do integracji z bazą. W ramach bieżącego budżetu 1000 zł mogę zaproponować podstawową realizację MVP, która pokryje główny scenariusz:
parsowanie plików wejściowych,
wyciąganie kluczowych pól,
podstawowe porównanie z BD po unikalnym polu,
krótką instrukcję uruchomienia na Twoim komputerze.
… Jeśli będzie potrzebne bardziej uniwersalne rozwiązanie z podwyższoną elastycznością do zmian formatów, rozszerzoną walidacją, konfigurowalnymi zasadami wyszukiwania i bardziej wygodną architekturą do dalszego rozwoju — to również mogę zrealizować jako oddzielny etap.
Co otrzymasz na wyjściu:
ustrukturyzowany kod źródłowy,
requirements.txt,
instrukcję uruchomienia,
zrozumiałą logikę działania bez "magii" w kodzie.
Czas realizacji MVP: 2–4 dni
Koszt: 1000 zł
Gotowy do rozpoczęcia po uzgodnieniu przykładów plików wejściowych i struktury porównania z BD.
-
Dzień dobry
Aby ocenić, należy przejrzeć każde źródło danych i napisać pod nie skrypt.
Moja wstępna ocena: 1000 zł za utworzenie struktury bazy + 500 zł za każde źródło danych. Jeśli źródła mają całkowicie analogiczną strukturę (na przykład wiele plików w Excelu z identyczną tabelą w środku), liczy się to jako 1 źródło.
Proszę o kontakt.
-
Dzień dobry, mogę napisać taki parser. Mam tylko jedno pytanie dotyczące specyfikacji, piszecie: Skrypt musi określać:
• Czy jest zapis w bazie?
• Jakie informacje są nieobecne lub różnią się?
Ale nie jest jasne, co zrobić w tych przypadkach, czy nadpisywać dane, czy ignorować, czy jeszcze coś innego? Po wyjaśnieniu specyfikacji mogę przystąpić do pracy. Przykłady prac w profilu. Terminy z poprawkami i testami pracy 3-5 dni. Cena do wyjaśnienia specyfikacji.
-
198 Witam! Jestem gotów zająć się opracowaniem skryptu Python do automatyzacji twojej bazy. Mam doświadczenie w pisaniu parserów dla niestrukturalnego tekstu, dlatego będę w stanie skonfigurować elastyczną logikę zbierania danych z .docx, .xlsx i .pdf za pomocą kombinacji wyrażeń regularnych oraz bibliotek pdfplumber i python-docx.
Aby zapewnić stabilne działanie systemu, proponuję użycie pydantic — to pozwoli skryptowi automatycznie sprawdzać dane pod kątem błędów jeszcze przed ich porównaniem z bazą. Samą weryfikację zrealizuję za pomocą pandas, co zapewni szybkie przetwarzanie nawet dużych ilości informacji. Abyś nie musiał ciągle zmieniać kodu, wyciągnę kluczowe ustawienia wyszukiwania do osobnego pliku konfiguracyjnego.
Na wyjściu dostarczę czysty kod z komentarzami, plik zależności requirements.txt oraz krótką instrukcję do szybkiego uruchomienia na twoim komputerze. Będę zadowolony, mogąc omówić format twojej bazy danych i przystąpić do realizacji.
-
615 3 0 Witam.
W tym projekcie kluczowe jest nie tylko przeczytanie Word / Excel / PDF, ale stabilne wydobycie potrzebnych danych z różnych struktur, przekształcenie ich do jednolitego formatu i poprawna synchronizacja z aktualną bazą w Excelu.
Pracuję z automatyzacją w Pythonie, przetwarzaniem dokumentów, mapowaniem tabel, normalizacją i walidacją danych. Dla takich zadań ważne jest nie tylko wydobycie pól, ale także stworzenie zarządzanego pipeline'u: ekstrakcja -> normalizacja -> walidacja -> porównanie -> synchronizacja.
Proponuję zrealizować to poprzez oddzielne zasady/mapowania dla typów dokumentów, znormalizowaną pośrednią schemę i walidację przez pydantic, aby nowe lub zmienione formaty były łatwiejsze do podłączenia bez łamania całego procesu.
Pracuję z gitem, więc mogę przekazać wynik w wygodnym formacie: kod na GitHubie / GitLabie lub w archiwum, plus instrukcję uruchomienia, requirements.txt i podstawowe ustawienia środowiska.
Jeśli to konieczne, mogę zacząć od małego proof of concept przed zatwierdzeniem, lub na waszych próbkach: wziąć po 1 pliku Word / Excel / PDF, wydobyć kluczowe pola, pokazać znormalizowany wynik i jak dokładnie będzie wyglądać porównanie z bazą Excel lub mogę pokazać swój analogiczny system w pracy z moimi dokumentami.
Jeśli to konieczne, odpowiem na wszystkie pytania w wiadomościach prywatnych.
-
478 3 0 Proponuję rozwiązanie na AI (trzeba płacić za użycie) do strukturyzacji danych.
-
232 Cześć! Mam doświadczenie w tworzeniu elastycznych narzędzi do automatyzacji przetwarzania danych i ich walidacji.
Jak proponuję zrealizować Twój projekt:
Parsowanie: Użyję pdfplumber do PDF oraz python-docx/openpyxl do dokumentów. Dla tekstu niestrukturalnego opracuję logikę opartą na wyrażeniach regularnych (Regex) oraz elastycznych wzorcach wyszukiwania.
Walidacja przez Pydantic: To najlepsze rozwiązanie dla Twojego zapytania. Stworzę schematy danych, które automatycznie będą sprawdzać wprowadzane informacje pod kątem zgodności typów oraz obecności błędów jeszcze przed zapisaniem do bazy.
Praca z bazą danych: Zrealizuję weryfikację według unikalnego identyfikatora (ID/Email/SKU), skrypt będzie generował jasny raport: co zostało dodane, co się różni, a czego brakuje.
…
Elastyczność: Aby nie przepisywać kodu przy zmianie formatu, wyodrębnię logikę parsowania do oddzielnych plików konfiguracyjnych lub słowników wzorców.
Wynik: Czysty kod w Pythonie, requirements.txt oraz szczegółowa instrukcja (README.md) dotycząca uruchamiania w izolowanym środowisku (venv).
Jestem gotów omówić szczegóły i zaprezentować logikę przetwarzania na przykładzie jednego z Twoich plików. Czekam na feedback!
-
124 Dzień dobry! 👋
Mam doświadczenie w pracy z Pythonem oraz przetwarzaniu danych z różnych formatów plików. Mogę zrealizować skrypt, który będzie automatycznie parsował dane z **.docx, .xlsx oraz .pdf**, strukturyzował je i wykonywał **weryfikację z bazą danych według unikalnego identyfikatora**.
Co zrobię w ramach tego zadania:
Zrealizuję elastyczny parser z wykorzystaniem **pandas, openpyxl, python-docx oraz PyMuPDF/pdfplumber**.
Dodam logikę wyszukiwania po **słowach kluczowych oraz wyrażeniach regularnych**, aby poprawnie przetwarzać nawet niestrukturalny tekst.
Stworzę system **walidacji i porównania z bazą danych** (SQL lub inną — ustalimy).
Zrealizuję sprawdzenie: czy istnieje zapis, które pola różnią się lub są brakujące.
… W razie potrzeby użyję **pydantic do walidacji danych**, aby zwiększyć niezawodność przetwarzania.
Wynik otrzymasz w postaci:
czystego i zrozumiałego kodu (GitHub lub archiwum),
pliku **requirements.txt**,
krótkiej **instrukcji uruchomienia i konfiguracji**,
wyjaśnienia logiki działania skryptu.
Mogę również zaproponować architekturę, która pozwoli **łatwo dostosować skrypt do zmian w formacie plików bez przepisywania kodu**.
Jestem gotów omówić szczegóły, przykłady plików oraz format bazy danych.
Mogę przystąpić do pracy od razu po uzgodnieniu.
-
690 5 0 Cześć!
Mogę zrealizować taki skrypt. Mam duże doświadczenie w pracy z pandas, openpyxl, python-docx, w przetwarzaniu tekstu nieustrukturyzowanego, a także w pracy z bazami danych SQL/NoSQL. Proszę, prześlij przykład plików wejściowych i strukturę bazy danych w wiadomościach prywatnych.
Będę czekać!
-
1522 14 0 Witam! Mogę to zrealizować. Proszę napisać na prywatną wiadomość, aby omówić wszystkie szczegóły. Będę zadowolony ze współpracy!
-
826 3 0 Gemini powiedział
Twój wariant jest zasadniczo poprawny, ale dodajmy mu trochę więcej „ciężaru” i ekspertyzy. Klientowi ważne jest, aby zrozumiał, że bot to nie tylko „zabawa”, ale pełnoprawne profesjonalne narzędzie.
Oto jak można to sformułować, aby brzmiało przekonująco:
Dzień dobry! Zadanie jest całkowicie zrozumiałe, mam doświadczenie w tworzeniu podobnych parserów i systemów automatyzacji.
Jako najbardziej wygodną opcję realizacji, proponuję zrobić to w formacie bota Telegram. To da wam kilka istotnych zalet:
… Wygoda: Nie musicie instalować Pythona, bibliotek ani konfigurować środowiska na swoim komputerze. Po prostu przesyłacie plik na czat i natychmiast otrzymujecie wynik.
Dostępność: Skrypt będzie działał z dowolnego urządzenia (telefon, komputer stacjonarny, laptop) 24/7.
Elastyczność: Skonfiguruję bazę danych i walidację przez Pydantic, aby system wyraźnie widział różnice między waszymi plikami a bazą danych.
Autonomia: Pomogę wdrożyć bota na serwerze, więc nie będziecie musieli nic uruchamiać ręcznie.
Proponuję omówić szczegóły w wiadomościach prywatnych. Byłbym wdzięczny, gdybyście przesłali przykłady plików — ważne jest dla mnie, aby zobaczyć ich strukturę, aby dokładnie ocenić złożoność parsowania i skonfigurować poprawną logikę porównania z bazą. Pozdrawiam!
-
601 5 0 Witaj! Praca z danymi niestrukturalnymi to zawsze wyzwanie, które lubię. Głównym problemem takich zadań nie jest samo czytanie plików, ale to, aby skrypt nie "zepsuł się" na następnym dokumencie z powodu zbędnej spacji lub zmienionej czcionki.
-
764 5 1 Cześć! Mój profil to parsowanie danych nieustrukturyzowanych w Pythonie, robiłem coś podobnego. W stacku wszystko jest:
— python-docx / openpyxl / pdfplumber — do wyciągania danych z .docx, .xlsx, .pdf
— Adaptacyjny parser: regex + wyszukiwanie słów kluczowych dla tekstu bez wyraźnej struktury
— Strukturyzacja w DataFrame (pandas) → podział na kolumny
— Weryfikacja z bazą danych po unikalnym identyfikatorze: jest zapis / brak / różni się
— Czysty kod na GitHubie + requirements.txt + krótka dokumentacja uruchomienia
Dodatkowo: mogę dodać pydantic do walidacji i stworzyć plik konfiguracyjny, aby nie przepisywać kodu przy zmianie formatu plików wejściowych. Napisz — doprecyzuję strukturę twoich plików i bazy danych.
-
219 Cześć! Zadanie jest jasne i aktualne: praca z danymi nieustrukturyzowanymi to zawsze wyzwanie dla logiki parsowania. Mam doświadczenie w pracy z wymienionym stosem (pandas, PyMuPDF, python-docx) i jestem gotów wdrożyć elastyczne rozwiązanie.
Jak proponuję rozwiązać Twoje zadanie:
Adaptacyjne parsowanie: Zamiast sztywnych powiązań z współrzędnymi, używam wyszukiwania po kluczowych kotwicach i wyrażeń regularnych (RegEx). To pozwoli skryptowi „przetrwać” przy niewielkich zmianach w układzie dokumentów.
Architektura i Walidacja: Do struktury i weryfikacji danych obowiązkowo używam Pydantic. To gwarantuje, że do bazy trafią tylko ważne typy danych, a błędy będą wychwytywane na etapie parsowania, a nie zapisu.
Porównanie z bazą danych: Wdrożę logikę „sprawdzania różnic”: skrypt będzie wyraźnie podświetlał, jakich danych brakuje, a które kolidują z aktualną bazą (używając unikalnych ID).
…
Uniwersalność: Aby nie przepisywać kodu przy zmianie formatu, przeniosę ustawienia parsowania (słowa kluczowe, szablony) do oddzielnego pliku konfiguracyjnego (YAML lub JSON).
Co otrzymasz w efekcie:
Czysty, udokumentowany kod w Pythonie.
requirements.txt do szybkiego uruchomienia środowiska.
Instrukcję/rozmowę: Przeprowadzę krótkie szkolenie dotyczące uruchamiania i konfiguracji skryptu na Twoim komputerze, abyś mógł samodzielnie z nim pracować.
Jestem gotowa omówić strukturę Twojej bazy danych i przykłady plików, aby dokładniej określić terminy i koszty.
Twoje atuty na to stanowisko:
Pydantic: Klient wyróżnił to jako „plus”. W odpowiedzi podkreśliłam to. To pokazuje, że piszesz nowoczesny, niezawodny kod.
Pliki konfiguracyjne: Odpowiedź na pytanie „jak nie przepisywać kodu” — to przeniesienie ustawień do konfiguracji. To dojrzałe podejście programisty.
Szkolenie: Akcent na tym, że nie tylko przekażesz archiwum, ale pomożesz w uruchomieniu — to usuwa lęk klienta „nie poradzę sobie z cudzym kodem”.
-
404 1 0 Witam, chciałbym zająć się waszym projektem. Porozmawiajmy o szczegółach osobiście.
-
250 37 1 2 1 dzień - 4000 UAH
Dzień dobry! Jestem gotów wykonać ten projekt. Duże doświadczenie w tworzeniu różnych aplikacji.
-
150 Dzień dobry, zajmuję się parsowaniem od ponad 2 lat (opracowałem projekt Ispa Parser Generator). Dobrze znam zarówno C++, jak i Pythona.
-
172 1 1 Dzień dobry! Jestem gotów wykonać ten projekt. Mam duże doświadczenie w tworzeniu różnych aplikacji.
-
168 Sens gadania po prostu wezmę i zrobię, bez zbędnych słów)))))))
-
265 Dzień dobry!
Mam duże doświadczenie w tworzeniu skryptów Python do automatyzacji przetwarzania danych, parsowania dokumentów oraz integracji z bazami danych. Pracowałem z pandas, openpyxl, python-docx, pdfplumber/PyMuPDF, a także realizowałem elastyczne parsery dla niestrukturalnych plików z wykorzystaniem wyrażeń regularnych oraz logiki wyszukiwania po kluczowych polach. Mogę zrealizować pełny pipeline: parsowanie .docx/.xlsx/.pdf, strukturyzowanie danych w tabelach, walidację oraz porównanie z bazą danych po unikalnym identyfikatorze z formowaniem zrozumiałego raportu o brakujących lub zmienionych polach. Proponuję przejść do wiadomości prywatnych, aby omówić format waszych plików, strukturę bazy danych oraz uzgodnić koszt i terminy realizacji.
-
1562 7 0 Wchodzę do top-10 deweloperów w kategorii „Sztuczna inteligencja i uczenie maszynowe” wśród ~2100 specjalistów na platformie. Gwarantuję: - Szybkie i jakościowe wykonanie zadania - Ścisłe przestrzeganie terminów - Regularny kontakt przez cały proces Będę zadowolony, aby omówić szczegóły twojego projektu w prywatnych wiadomościach.
-
4028 11 0 2 Witam. Jestem gotów opracować skrypt w Pythonie do parsowania danych z .docx, .xlsx i .pdf, ich strukturyzacji, walidacji oraz porównania z bazą danych. Mam doświadczenie w pracy z Pythonem, pandas, openpyxl, przetwarzaniu dokumentów, parsowaniu danych nieustrukturyzowanych, wyrażeniami regularnymi oraz budowie zrozumiałej logiki przetwarzania. Mogę również wdrożyć elastyczną architekturę, aby przy zmianie formatu plików nie było konieczności całkowitego przepisywania kodu. Co mogę zrobić w ramach projektu: parsowanie danych z różnych formatów; rozkładanie informacji po potrzebnych polach; porównanie z bazą danych według unikalnego identyfikatora; wykrywanie brakujących lub zmienionych danych; przygotowanie instrukcji uruchamiania i konfiguracji; w razie potrzeby — krótki instruktaż dotyczący pracy ze skryptem.
-
687 8 0 Na Borland Delphi można napisać.
Z Excelem jest trochę trudniej, ponieważ tam jest różna
liczba kolumn. To znaczy osobny program.
Mam wiedzę z Pythona. Ale nie ma pewności, że będę to stosować w tym zadaniu.
-
417 2 0 -
358 1 0 Dzień dobry!
Mam doświadczenie w pracy z parsowaniem danych w formatach .docx, .xlsx i .pdf, wcześniej realizowałem automatyzację dla procesów księgowych. Chciałbym doprecyzować szczegóły dotyczące samych dokumentów — jak bardzo mogą się różnić pod względem struktury, aby prawidłowo wprowadzić adaptacyjną logikę przetwarzania.
Mogę zaproponować nie tylko skrypt, ale także rozwiązanie GUI do wygodnego zarządzania procesem (ładowanie plików, uruchamianie przetwarzania, przeglądanie wyników). Oczywiście, zostanie przygotowana pełna dokumentacja projektu z instrukcjami uruchamiania i konfiguracji.
Oto mój GitHub do zapoznania się z przykładami prac: [https://github.com/NazarShubeliak].
-
588 0 1 Witam, opracowuję skrypty do parsowania danych w celu wydobycia różnych formatów dokumentów, za pomocą Pythona (pandas, pdfplumber, python-docx). Mogę zapisać dane w formacie parquet lub stworzyć bazę danych w postrgesql. Jeśli potrzebujesz serwera, jestem gotów go stworzyć na Dockerze. Po pomyślnej realizacji umieszczę na githubie z instrukcją instalacji.
-
2138 22 2 cześć
mam doświadczenie w podobnych projektach
1. czy można zobaczyć przykład danych? trzeba zrozumieć, czy możliwe jest wyciągnięcie informacji z tych plików.
2. trzeba również zrozumieć, czy dane można zorganizować w zwykły sposób, czy będzie konieczne użycie sztucznej inteligencji.
3. najlepiej zapakować projekt w Dockera, będzie można wygodnie korzystać.
piszcie, omówimy szczegóły
-
2211 18 3 Witam! Mogę zrealizować taki parser. Pracuję z Pythonem (pandas, pdfplumber, pydantic).
Moje podejście: zamiast kruchych wyrażeń regularnych dla niestrukturalnego tekstu proponuję wykorzystanie integracji AI. To gwarantuje, że skrypt znajdzie potrzebne pola, nawet jeśli ich kolejność w pliku się zmieni. Dla Excela i danych strukturalnych pozostawiamy klasyczne przetwarzanie dla szybkości.
Zrobię jasną dokumentację, abyś mógł uruchomić skrypt bez mojej pomocy. Czekam na przykłady plików do omówienia ostatecznej ceny.
-
656 9 0 Dzień dobry, Rostysław!
Ogólnie zadanie jest zrozumiałe, aby uzyskać dokładną odpowiedź na temat terminów i ceny, chciałbym wyjaśnić kilka kwestii, które pojawiły się po analizie twojego zadania.
Pisz w prywatnych wiadomościach – omówimy szczegóły i twoje życzenia.
-
4975 41 4 1 Dzień dobry!
Profesjonalnie opracowuję rozwiązania w Pythonie do parsowania danych niestrukturalnych (Word, Excel, PDF) oraz synchronizacji z bazą danych. Mam doświadczenie z pandas, openpyxl, python-docx, PyMuPDF oraz adaptacyjnymi parserami.
Napisz do mnie w wiadomości prywatnej, omówimy szczegóły projektu.
-
284 Cześć! Mam doświadczenie w tworzeniu adaptacyjnych parserów do nieustrukturyzowanego tekstu (Regex + logika kluczy).
Mój sposób podejścia do twojego zadania:
Stos: pdfplumber i python-docx do czystego wyciągu danych; pydantic do walidacji przed zapisaniem do bazy danych.
Elastyczność: Wyciągnę ustawienia (pola, słowa kluczowe) do pliku konfiguracyjnego, abyś mógł dostosować skrypt do nowych plików bez edytowania kodu.
Synchronizacja: Ustawię jasną logikę porównania z bazą danych według ID (logika UPSERT), abyś widział rozbieżności i brakujące rekordy.
…
Wynik: Czysty kod z komentarzami + requirements.txt + wideo instrukcja uruchomienia na twoim komputerze.
Jestem gotowa omówić szczegóły i przejrzeć przykłady plików w wiadomościach prywatnych!
-
1251 35 1 3 Witam, jestem gotów to zrobić. Mam całe niezbędne doświadczenie w pracy z bibliotekami i plikami. Proszę przesłać mi pliki na prywatną wiadomość, dokładnie je przejrzę.
-
1239 16 0 Witam!
Ogólnie specjalizuję się w scraperach i parserach, więc mogę wykonać Twoje zadanie. Prawda, chciałbym najpierw spojrzeć na przykłady plików wejściowych, aby zrozumieć stopień "złożoności" danych wejściowych. Właściwie to wpłynie na cenę i termin (obecnie podane są dowolne).
Przekażę skrypty w wygodnej formie, wyjaśnię działanie, w razie potrzeby pomogę w konfiguracji środowiska.
-
691 5 0 Witam! Zainteresował mnie Twój projekt. Mam duże doświadczenie w:
📊 Przetwarzanie danych: praca z bazami, strukturyzacja i analiza informacji, automatyzacja przetwarzania dużych ilości danych, import/eksport i walidacja;
🤖 Automatyzacja i emulacja działań użytkownika; rozwój botów o różnym stopniu skomplikowania;
⚡️ Asynchroniczne i wielowątkowe parsowanie: zbieranie i przetwarzanie danych z optymalizacją wydajności;
🔍 OCR i wyszukiwanie tekstu: rozpoznawanie i strukturyzacja informacji;
🖼 Przetwarzanie mediów: praca z obrazami i multimediami;
🖥 Rozwój oprogramowania, aplikacji desktopowych, usług systemowych i serwisów;
📱 Rozwój mobilny: aplikacje natywne i wieloplatformowe;
… 🌐 Praca z API i zewnętrznymi usługami: integracja, automatyzacja i wymiana danych;
🗣 Tłumaczenie i przetwarzanie tekstu: automatyzacja tłumaczenia, praca z modelami językowymi i analizą tekstu;
🤖 Rozwiązania AI/LLM: integracja i wykorzystanie sztucznej inteligencji, praca z modelami językowymi i automatyzacja procesów inteligentnych.
Wykonam pracę szybko i jakościowo. Skontaktuj się ze mną, aby omówić szczegóły i terminy realizacji projektu!
-
2506 20 0 Dzień dobry, jestem gotowy wykonać twoje zadanie szybko i jakościowo. Mam duże doświadczenie w tworzeniu różnych parserów. Napisz w wiadomościach prywatnych, omówimy szczegóły. Chętnie pomogę)
-
426 10 2 Cześć!
Mam doświadczenie w pracy z podobnymi zadaniami.
Mogę napisać adaptacyjny skrypt, podłączyć do niego OpenAI API, co poprawi przetwarzanie dokumentów o słabej jakości.
Piszcie na prywatne, wszystko omówimy.
-
390 Mam doświadczenie w parsowaniu Pythonem Word, Excel i PDF, w tym z tekstem niestrukturalnym. Używam pandas, openpyxl, python-docx, PyMuPDF/pdfplumber, wyrażeń regularnych oraz logiki słów kluczowych do dokładnego wydobywania danych.
Mogę stworzyć skrypt, który:
adaptacyjnie parsuje różne formaty plików,
strukturyzuje dane według pól,
porównuje z bazą danych (SQL/NoSQL) i wykrywa brakujące lub różne rekordy,
…
zawiera dokumentację i instrukcję do uruchomienia.
Jestem gotów zaproponować rozwiązanie, które jest łatwe w utrzymaniu i skalowalne w zależności od zmian formatów plików.
-
Може краще 700 грн? Бо наче 1000 дорогувато за такий простий скрипт, хай чатгопота сгенеруй, впорається за 2 хвилини 🤣🤣🤣
-
Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych
Parsowanie produktów, przygotowanie do importu na WPWydobyć pełny katalog tych stron: https://svit-mebliv.ua/ https://kompanit.com.ua/ru https://amia.com.ua/ https://mebliromax.com.ua/ https://pehotin.com.ua/catalog/ https://www.sokme.ua/ru/ Wszystkie produkty muszą być połączone w jedną wspólną tabelę do importu do WP. Każdy… Programowanie stron internetowych, Parsowanie danych ∙ 2 godziny 10 minut temu ∙ 26 ofert |
Szukam programisty do OpenCartDzień dobry 1) należy wdrożyć na stronie dneprkomfort.dp.uazakupiono moduł dla ukraińskich banków, już wdrożono Monto bank oto przykład naszego konkurenta Trzeba zrobić rozłożenie na raty, zakupy na raty (Monto Bank) Pumb, Sens, Monto domyślnie 2 płatności na 2 miesiące Pumb… Programowanie stron internetowych, Parsowanie danych ∙ 23 godziny 30 minut temu ∙ 46 ofert |
Wymagany specjalista ds. promocji w Telegramie.
107 PLN
Zadania: zapraszanie rzeczywistych użytkowników z bazy nazw użytkowników do nowych czatów oraz wysyłanie wiadomości do docelowej bazy. Interesuje nas tylko jakościowy ruch i praca z żywą publicznością — wykonawców korzystających z botów, sztucznego zwiększania lub niskiej… Parsowanie danych, Promocja w sieciach społecznościowych (SMM) ∙ 5 dni 1 godzina temu ∙ 9 ofert |
Konsultacja dotycząca parsowania subskrybentów kont InstagramWitam. Konieczne jest przeprowadzenie wstępnej oceny możliwości realizacji następującego zadania. Posiadam listę kont na Instagramie. Celem jest uzyskanie danych kontaktowych (w pierwszej kolejności adresów e-mail) użytkowników, którzy obserwują te konta. Wcześniej spotkałem… Parsowanie danych ∙ 8 dni 20 godzin temu ∙ 13 ofert |
Potrzebny specjalista do wyszukiwania kontaktów decydentów w UkrainieKonieczne jest zebranie bazy (lub gotowej bazy) kontaktów osób podejmujących decyzje (LPR) w firmach Ukrainy. Wyszukiwanie i zbieranie informacji, Parsowanie danych ∙ 9 dni 1 godzina temu ∙ 21 ofert |