Należy sparsować plik pdf
Konieczne jest przetworzenie pliku PDF na tabelę Excel według przykładu https://docs.google.com/spreadsheets/d/1bGOybbQaQ0_Wq5ccjQfpvHfr0iz8ePdI9r2i_IJakYY/edit?usp=sharing
Zgodność i nazwy kategorii oraz podkategorii można sprawdzić na stronie https://balluff-ua.com/product
Następnie te dane będą wprowadzane na stronę,
Obecnie jest tam problem, wiele produktów nie odpowiada swojej kategorii, jest baza SQL z poprawnym układem, ale to będzie drugie zadanie osobno ocenione i sformułowane
W przypadku przetwarzania, tam jest problem, nie wszystkie kolumny są symetryczne, można na razie wziąć za priorytet i przetworzyć tylko:
kategorię Czujniki (SENSORS) i jej podkategorie
podkategorie
- Czujniki indukcyjne (Inductive ...)
- Czujniki pojemnościowe (Capasitive)
- i tak dalej zgodnie z tą stroną https://balluff-ua.com/product/datchiki
Załączniki 2
-
Dzień dobry. To trudne zadanie, ale wyłącznie z powodu potrzeby mapowania kategorii bez konkretnych wskazówek na ten temat. Jeśli będzie szczegółowa instrukcja lub alternatywna metoda, cena będzie niższa.
-
Dzień dobry
przeanalizowałem kawałek https://docs.google.com/spreadsheets/d/1VrUl-Fax9QFm9W7DfT-VU6OYzqEn1UxUAWqwAzPA1dA/edit?gid=0#gid=0
tak?
Proszę o odpowiedź
-
Witam! Zajmuję się tworzeniem parserów od ponad 3 lat. Będę mógł rozparsować twoje pliki zgodnie z instrukcjami.
Dziś jestem gotowy, aby zacząć pracować, a jutro dostarczyć gotowy wynik.
-
315 Jestem gotowy do pracy w każdej chwili, terminy i koszt możemy omówić, napisz, a ja wyślę dane kontaktowe do kontaktu.
-
138 Witaj! Jestem gotów zrealizować parsowanie twojego pliku PDF w języku C#. Mam doświadczenie w pracy z wyrażeniami regularnymi (Regex) do precyzyjnego wydobywania danych. Na wyjściu dostarczę ustrukturyzowany wynik (JSON/Excel/Tekst). Pracuję przez Safe.
-
297 1 0 Eugeniusz, dzień dobry!
Przeanalizowałem twój plik PDF z cenami, przykład tabeli i strukturę strony balluff-ua.com
Co dokładnie zrobię:
1. Synchronizacja z witryną: Przeanalizuję drzewo kategorii na balluff-ua.com/product i skonfiguruję skrypt tak, aby dane z PDF automatycznie pasowały do odpowiednich sekcji strony (Czujniki -> Czujniki indukcyjne itd.). W kolumnach A i B będziesz miał idealny porządek do importu.
2. Rozwiązanie problemu "krzywych" kolumn: Do wydobywania danych użyję metody współrzędnych (biblioteka pdfplumber). To pozwoli poprawnie rozdzielić "Numer części", "Kod zamówienia" i "Cena", nawet jeśli w PDF tekst jest przesunięty lub kolumny mają różną szerokość.
3. Zgodność z SQL: Otrzymasz plik (Excel/CSV), w którym dane są już zorganizowane pod twoją bazę SQL, co wyeliminuje błędy podczas ładowania na stronę.
Moja przewaga: Nie tylko kopiuję tekst, ale tworzę algorytm, który "rozumie" hierarchię produktów.
…
Będę zadowolony, aby omówić szczegóły!
-
172 1 1 Dzień dobry. Jestem gotów zrealizować ten projekt, mam duże doświadczenie w tworzeniu różnych aplikacji.
-
372 4 0 Witam. Zapoznałem się z zadaniem i jestem gotów pomóc w parsowaniu katalogu Balluff. Mam doświadczenie w pracy z trudnym układem PDF, gdzie kolumny są rozmieszczone asymetrycznie, dlatego do wyciągania danych użyję skryptów Pythona, które pozwalają dokładnie dostosować przetwarzanie każdej strony i zachować hierarchię kategorii. Wezmę pod uwagę strukturę sekcji czujników z witryny, aby indukcyjne, pojemnościowe i inne typy urządzeń trafiły do odpowiednich kolumn Excela zgodnie z waszym przykładem. Ponieważ wspomnieliście o istnieniu bazy SQL z poprawnym układem, będę również mógł w przyszłości pomóc w synchronizacji tych danych dla witryny, ponieważ rozumiem logikę powiązań w bazach danych.
-
758 6 0 Dzień dobry! Mam duże doświadczenie w parsowaniu dokumentów. Proszę powiedzieć, czy trzeba sparsować jeden plik pdf? Jaki jest jego rozmiar?
Średnio mogę to wykonać w ciągu 2-3 dni.
-
1344 6 0 Cześć!
Rozumiem, że trzeba sparsować plik pdf do tabeli exel zgodnie z przykładem, a następnie wprowadzić dane na stronę.
Zrobię to za pomocą n8n, Google Sheets i Apps Script.
Napisz szczegóły — ustalę terminy i koszt.
-
1315 7 0 Dzień dobry.
Jestem gotów podjąć się pracy.
Mogę stworzyć automatyzację, która sparsuje i skategoryzuje Twoje pliki.
Piszesz na prywatne, omówimy ewentualne niuanse i będziemy mogli przystąpić.
-
1252 16 0 Witaj!
Zrozumiałem Twoje zadanie, podejrzewam, że taki PDF masz albo nie jeden, albo będzie ich więcej. Dlatego proponuję od razu napisać parser, który będzie przyjmował plik PDF jako wejście i wydawał ważny plik excel jako wyjście. Będziesz musiał tylko uruchomić skrypt i wskazać mu ścieżkę do Twojego pliku.
Język Python.
W razie potrzeby skrypt zostanie skompilowany do aplikacji dla Windows (plik exe).
-
702 1 0 Cześć! Mam duże doświadczenie w parsowaniu. Dlatego oferuję lojalną cenę i wysoką jakość pracy. Pisz)
-
886 3 0 Cześć! Jestem programistą Pythona, specjalizuję się w parsowaniu danych i automatyzacji (PDF, Web, SQL).
Co zrobię:
1. Zajmę się krzywymi kolumnami: Napiszę skrypt, który poprawnie przetworzy dwukolumnowy układ PDF, aby dane się nie pomieszały.
2. Przyporządkuję do kategorii: Ustawię automatyczne przypisanie produktów do odpowiednich sekcji (Indukcyjne, Pojemnościowe itd.), kierując się strukturą strony Balluff.
3. Przygotuję Excel: Otrzymasz tabelę dokładnie według twojego wzoru, gotową do importu.
W sprawie drugiego zadania z bazą SQL również jestem gotów pracować. Pisz na priv, omówimy terminy i budżet!
-
3928 101 0 Cześć. Jestem gotowy pomóc w tym zadaniu. W pdf znajduje się wszelkie wystarczające informacje do pracy. 1 dzień, 800 zł.
-
5883 345 0 Mogę przenieść dane z PDF do Excela bez "zobaczyć na stronie"
-
3367 148 4 1 Dzień dobry.
Zrobię rozwiązanie na node js, które poprawnie przetworzy plik.
Cena i termin są do uzgodnienia.
Jeśli masz pytania, możesz napisać do mnie w wiadomości prywatnej.
-
4182 198 2 5 Mam doświadczenie w parsowaniu PDF do formatów tabelarycznych z zachowaniem struktury kategorii, w tym z asymetrycznymi kolumnami. W tym celu stosowałem różnorodne biblioteki PHP oraz narzędzia Pythona, zintegrowane w procesy robocze.
W Państwa przypadku wezmę za podstawę kategorie „Czujniki” i ich podkategorie, zgodnie z zadaniem i stroną balluff-ua.com. Ostateczna tabela Excel będzie zorganizowana w taki sposób, aby ułatwić ładowanie danych na stronę i poprawne wyświetlanie kategorii.
Używam PHP w połączeniu z Laravel, co przyspieszy pracę z bazą (MySQL/PostgreSQL) i ułatwi dalszą integrację. Mam doświadczenie w REST API i eksportowaniu danych złożonych struktur — to pomoże w dalszym automatycznym aktualizowaniu danych.
Proponuję najpierw stworzyć wersję demo parsera dla wybranych kategorii, aby upewnić się o poprawności danych, a następnie przejść do dalszego rozwoju i integracji z bazą danych w następnym etapie. Mogę zorganizować proces przez Docker dla uproszczenia uruchamiania i debugowania.
Jestem gotów omówić szczegóły i rozpocząć według Państwa harmonogramu.
-
693 15 0 2 Dzień dobry! Rozparsuję twój plik pdf do excela szybko i jakościowo! Już robiłem podobne projekty! Będę zadowolony, że mogę ci pomóc!)
-
240 Cześć, Jewgienij!
Twój przypadek: parsowanie katalogu PDF Balluff do Excela według szablonu z Google Sheets (masz go otwarte) + zgodność kategorii/podkategorii na balluff-ua.com/product. Start — kategoria Czujniki (SENSORS) i jej podkategorie.
Plan:
1. Pobieram PDF + tabelę-szablon + strukturę kategorii ze strony balluff-ua.com. Jeśli jest link do PDF — od razu go biorę; jeśli plik jest załączony w FH — prześlij go w komentarzach do projektu.
2. Piszę parser w Pythonie (pdfplumber / tabula do tabel + niestandardowa logika dla asymetrycznych kolumn, jak opisałeś). Dla pozycji, gdzie struktura się łamie, daję fallback z ręcznym przetwarzaniem.
3. Normalizacja: porównuję artykuły z podkategoriami balluff-ua — robię to na podstawie dokładnego dopasowania kodu + fallback według nazwy kategorii. Nieprzypisane pozycje oznaczam osobnym statusem „needs_review”.
… 4. Eksport do Excela ściśle według twojego szablonu Google Sheets: te same kolumny, te same typy danych, ten sam format.
5. Oddaję ci XLSX + krótki ReadMe: ile pozycji zostało sparsowanych poprawnie, ile trafiło do needs_review i dlaczego. Żebyś od razu widział jakość.
Koszt: 3 000 UAH za parsowanie Czujników i jej podkategorii do tabeli według szablonu. Termin 3–4 dni robocze od otrzymania pliku.
Drugie zadanie (porównanie z twoją bazą SQL poprawnej kompozycji) chętnie wycenię osobno, gdy prześlesz zrzut schematu bazy.
Prześlij w komentarzach do projektu: sam PDF (lub link), potwierdzenie, że szablon google sheets jest aktualny, a jeśli masz — przykład „poprawnie przypisanej” pozycji do kalibracji.
-
смотрите "можно смотреть на сайте" это значит что нужно реализовать парсинг сайта, чтобы просто посмотреть. Поэтому хотелось бы чтобы вы уточнили тз, а именно
1) распарсить пдф, и вы точно указываете пример данных из пдф и что и куда заливать в гугл таблицу
2) имея данные из пдф в нужной форме уже ставить задачу поиска этих данных на сайте и заполнить категории, либо что-то еще.
Желательно разбить это двумя подзадачами, чтобы за каждую определять свой бюджет. Ну если конечно Вы хотите по нормальному.
-
Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych
Wymagany specjalista ds. promocji w Telegramie.
106 PLN
Zadania: zapraszanie rzeczywistych użytkowników z bazy nazw użytkowników do nowych czatów oraz wysyłanie wiadomości do docelowej bazy. Interesuje nas tylko jakościowy ruch i praca z żywą publicznością — wykonawców korzystających z botów, sztucznego zwiększania lub niskiej… Parsowanie danych, Promocja w sieciach społecznościowych (SMM) ∙ 1 dzień 20 godzin temu ∙ 8 ofert |
Zbieranie bazy danych B2B firm w Niemczech
149 PLN
Cel: Uzyskanie listy potencjalnych pracodawców (klientów) do wysyłki B2B. Region: Monachium (München) + promień 50 km. Wymagane nisze: Firmy budowlane (Bauunternehmen) Przemysł spożywczy (Lebensmittelhersteller, zakłady mięsne, piekarnie) Logistyka i kompleksy magazynowe… Parsowanie danych, Sprzedaż i generowanie leadów ∙ 1 dzień 22 godziny temu ∙ 31 ofert |
Konsultacja dotycząca parsowania subskrybentów kont InstagramWitam. Konieczne jest przeprowadzenie wstępnej oceny możliwości realizacji następującego zadania. Posiadam listę kont na Instagramie. Celem jest uzyskanie danych kontaktowych (w pierwszej kolejności adresów e-mail) użytkowników, którzy obserwują te konta. Wcześniej spotkałem… Parsowanie danych ∙ 5 dni 15 godzin temu ∙ 12 ofert |
Potrzebny specjalista do wyszukiwania kontaktów decydentów w UkrainieKonieczne jest zebranie bazy (lub gotowej bazy) kontaktów osób podejmujących decyzje (LPR) w firmach Ukrainy. Wyszukiwanie i zbieranie informacji, Parsowanie danych ∙ 5 dni 19 godzin temu ∙ 18 ofert |
Trzeba zeskrobać dane z LinkedInPotrzebujemy wyciągnąć dane z LinkedIn według naszej listy. Dla każdego wpisu należy znaleźć i zebrać dostępne dane, jeśli takie są na profilu LinkedIn, w tym zdjęcie profilowe w serwisie społecznościowym LinkedIn, adres e-mail, linki do mediów społecznościowych, stronę… Parsowanie danych ∙ 6 dni 1 godzina temu ∙ 28 ofert |