Inteligentny parser PDF do Excela i narzędzie do automatyzacji sieciowej
Opracowałem kompleksowe rozwiązanie oparte na Pythonie do automatyzacji rutynowych zadań związanych z przetwarzaniem dokumentacji technicznej oraz interakcją z zasobami internetowymi. Program pozwala na przekształcenie godzin ręcznej weryfikacji katalogów w zaledwie kilka sekund zautomatyzowanej pracy.
Kluczowa funkcjonalność:
Inteligentne parsowanie (PDF Extraction): Automatyczne skanowanie skomplikowanych plików PDF, wydobywanie artykułów (NSN) oraz odpowiednich opisów produktów.
Generacja Smart-Excel: Tworzenie zorganizowanych tabel z wbudowanymi hiperlinkami do natychmiastowego przejścia do formularza zapytania.
Automatyzacja Web (Playwright): Pełna automatyzacja interakcji z witryną — skrypt samodzielnie otwiera przeglądarkę i wypełnia niezbędne formularze, eliminując czynnik ludzki oraz błędy.
Graficzny interfejs użytkownika (GUI): Opracowano wygodne okno sterowania w Tkinter z paskiem postępu do monitorowania statusu przetwarzania w czasie rzeczywistym.
Stos technologiczny:
Język: Python
Biblioteki: Playwright (automatyzacja przeglądarki), Pandas (praca z danymi), pdfplumber (parsowanie tekstu), Tkinter (interfejs).
Kluczowa funkcjonalność:
Inteligentne parsowanie (PDF Extraction): Automatyczne skanowanie skomplikowanych plików PDF, wydobywanie artykułów (NSN) oraz odpowiednich opisów produktów.
Generacja Smart-Excel: Tworzenie zorganizowanych tabel z wbudowanymi hiperlinkami do natychmiastowego przejścia do formularza zapytania.
Automatyzacja Web (Playwright): Pełna automatyzacja interakcji z witryną — skrypt samodzielnie otwiera przeglądarkę i wypełnia niezbędne formularze, eliminując czynnik ludzki oraz błędy.
Graficzny interfejs użytkownika (GUI): Opracowano wygodne okno sterowania w Tkinter z paskiem postępu do monitorowania statusu przetwarzania w czasie rzeczywistym.
Stos technologiczny:
Język: Python
Biblioteki: Playwright (automatyzacja przeglądarki), Pandas (praca z danymi), pdfplumber (parsowanie tekstu), Tkinter (interfejs).