Pdf_table_Parsing
Mały projekt w Pythonie do przetwarzania tekstowych dokumentów PDF z tabelami.
Funkcjonalność:
Projekt potrafi analizować PDF, w których tabele mogą znajdować się w różnych miejscach dokumentu (na początku lub na końcu), ale zawsze są określane przez charakterystyczne "punktowe" napisy.
Zrealizowano przetwarzanie dwóch głównych tabel: ECU SUMMARY INFO i ECU SUMMARY INFO (CONT...). Te tabele są automatycznie łączone w jedną wspólną.
Po głównych tabelach wyodrębniane są dodatkowe tabele ECU DETAILS, które zawierają szczegółowe parametry w formacie NAME=VALUE dla każdego wpisu z głównej tabeli.
Wszystkie dane są przekształcane do jednolitej dynamicznej struktury (na przykład w postaci słowników lub zagnieżdżonych obiektów Pythona), co umożliwia wygodne dalsze z nimi prace.
Uwzględniono wsparcie dla tabel z różną liczbą wpisów.
Funkcjonalność:
Projekt potrafi analizować PDF, w których tabele mogą znajdować się w różnych miejscach dokumentu (na początku lub na końcu), ale zawsze są określane przez charakterystyczne "punktowe" napisy.
Zrealizowano przetwarzanie dwóch głównych tabel: ECU SUMMARY INFO i ECU SUMMARY INFO (CONT...). Te tabele są automatycznie łączone w jedną wspólną.
Po głównych tabelach wyodrębniane są dodatkowe tabele ECU DETAILS, które zawierają szczegółowe parametry w formacie NAME=VALUE dla każdego wpisu z głównej tabeli.
Wszystkie dane są przekształcane do jednolitej dynamicznej struktury (na przykład w postaci słowników lub zagnieżdżonych obiektów Pythona), co umożliwia wygodne dalsze z nimi prace.
Uwzględniono wsparcie dla tabel z różną liczbą wpisów.